问题标签 [frequency-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
8437 浏览

r - 从R中的频率表计算分组方差

我如何在 R 中从如下所示的数据集中计算总体方差和每个组的方差(例如):

我知道要从整体上计算方差,而忽略我会做的组: var(rep(x$Value, x$Count)), 但是如何自动计算每个组的方差并考虑频率?例如,A 组、B 组等的方差......我希望我的输出具有以下标题:

我还查看了此链接;R计算平均值,中位数,来自具有不同频率分布的文件的方差(没有组分量),因此这不是重复的。

感谢您的所有帮助。

0 投票
1 回答
634 浏览

python - NLTK FreqDist 不再工作

我对 python 和 NLTK 比较陌生,但我编写了一个使用来自 NLTK 的 FreqDist 的程序。上周它一直按预期工作,但今天它返回:'FreqDist' 对象没有属性'most_common'

有谁知道这是为什么?就像我说的,在此之前一切正常,我没有对代码进行任何更改。

编辑:这是相关代码:

不确定还有什么需要 - 输入列表是单词列表。昨晚还好好的...

谢谢!

0 投票
2 回答
1521 浏览

r - r element frequency and column name

I have a dataframe that has four columns A, B, C and D:

I would like to get the frequency of all elements and lists of columns they appear, ordered by the frequency ranking. The output would be something like this:

I would appreciate any help. Thank you!

0 投票
2 回答
711 浏览

python - 我需要找到来自零售连锁网络的数据分布。没有分布适合数据

我需要找到来自零售连锁网络的数据分布(所有商店的产品需求)。我尝试使用 EasyFit(它有 82 个分布来检查最佳分布)来拟合分布,但没有分布适合数据。可以做什么?有什么方法可以确定数据分布是多重分布的总和还是卷积?我已经从数据集中删除了峰值、季节性或促销数据,但仍然不适合分布。

0 投票
2 回答
207 浏览

python - 为条件频率分布创建标记和文本元组

我想创建一个表格,显示某些单词在 3 个文本中的频率,而文本是列,单词是行。

在表格中,我想查看哪个单词在哪个文本中出现的频率。

这些是我的文字和文字:

为了创建条件频率分布,我想创建一个看起来像 lot = [('text1', 'blood'), ('text1', 'young'), ... ('text2' , '血液'), ...)

我试图创造很多这样的:

而不是 lot = ('text1', 'blood') etc. 而不是 'text1' 是列表中的整个文本。

如何创建用于条件频率分布函数的元组列表?

0 投票
2 回答
1713 浏览

python - Python中遵循线性下降分布的随机数

我想生成遵循下降线性频率分布的随机数,以 n=1-x 为例。

然而,numpy 库似乎只提供更复杂的分布。

0 投票
3 回答
2960 浏览

python - 频率分布比较 Python

我正在使用 python 和 nltk 来研究一些文本,我想比较不同文本中词性的频率分布。

我可以为一个文本做到这一点:

我试图添加另一个,但没有太多运气。我有条件频率分布示例,用于比较多个文本中三个单词的计数,但我希望这些行代表四个不同的文本,y 轴代表计数,x 轴代表不同的文本词性。如何比较同一图表中的文本 Y 和 Z?

0 投票
3 回答
5568 浏览

c++ - 用c ++绘制频谱

请参阅此问题下方答案中的编辑。

我编写了一个脚本来用 c++ 绘制正弦信号的频谱。以下是步骤

  1. 应用汉宁窗
  2. 使用 fftw3 库应用 FFT

我有三个图:信号,信号何时乘以汉宁函数,以及频谱。频谱看起来不对。它应该在 50 Hz 处有一个峰值。任何建议将不胜感激。这是代码:

我必须补充一点,在将结果插入到 example2.txt 之后,我已经使用 gnuplot 绘制了图表。所以 ff[i] vs v[i] 应该给我频谱。

以下是图表:在此处输入图像描述 频谱和正弦时间窗口分别为: 在此处输入图像描述

0 投票
2 回答
7786 浏览

r - 有没有办法让 R 中的密度()函数使用计数与概率?

有没有办法让 R 中的密度()函数使用计数与概率?

例如,在使用直方图函数检查密度分布时,我有两个选项hist

我想知道是否有办法使用该density功能做类似的事情?

在我的具体示例中,我计算了不同直径的树木。(我会注意到,我将数据保留为连续的大小比例,而不是将它们集中到离散的大小类别中)。当我对density这些数据(即plot(density(dat$D,na.rm=T,from=0)))使用函数时,它为我提供了每种尺寸概率的密度估计(当然是平滑的)。我更有兴趣将这些数据报告为茎/面积与概率,所以我更喜欢密度估计来使用计数。

想法??


更新:

以下是一些真实的示例数据:

这里尝试尝试@eipi10建议的方法:

此代码创建以下 2 个图 [标题为post-hoc ]:

在此处输入图像描述

如您所见,这两种方法在 y 轴上产生了不同的值。换句话说,@eipi10 的方法对我不起作用:(。

0 投票
1 回答
1366 浏览

python - 频率分布图

有没有办法在 python 或 R 中绘制频率分布图? 在此处输入图像描述