问题标签 [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 从R中的频率表计算分组方差
我如何在 R 中从如下所示的数据集中计算总体方差和每个组的方差(例如):
我知道要从整体上计算方差,而忽略我会做的组:
var(rep(x$Value, x$Count)),
但是如何自动计算每个组的方差并考虑频率?例如,A 组、B 组等的方差......我希望我的输出具有以下标题:
我还查看了此链接;R计算平均值,中位数,来自具有不同频率分布的文件的方差(没有组分量),因此这不是重复的。
感谢您的所有帮助。
python - NLTK FreqDist 不再工作
我对 python 和 NLTK 比较陌生,但我编写了一个使用来自 NLTK 的 FreqDist 的程序。上周它一直按预期工作,但今天它返回:'FreqDist' 对象没有属性'most_common'
有谁知道这是为什么?就像我说的,在此之前一切正常,我没有对代码进行任何更改。
编辑:这是相关代码:
不确定还有什么需要 - 输入列表是单词列表。昨晚还好好的...
谢谢!
r - r element frequency and column name
I have a dataframe that has four columns A, B, C and D:
I would like to get the frequency of all elements and lists of columns they appear, ordered by the frequency ranking. The output would be something like this:
I would appreciate any help. Thank you!
python - 我需要找到来自零售连锁网络的数据分布。没有分布适合数据
我需要找到来自零售连锁网络的数据分布(所有商店的产品需求)。我尝试使用 EasyFit(它有 82 个分布来检查最佳分布)来拟合分布,但没有分布适合数据。可以做什么?有什么方法可以确定数据分布是多重分布的总和还是卷积?我已经从数据集中删除了峰值、季节性或促销数据,但仍然不适合分布。
python - 为条件频率分布创建标记和文本元组
我想创建一个表格,显示某些单词在 3 个文本中的频率,而文本是列,单词是行。
在表格中,我想查看哪个单词在哪个文本中出现的频率。
这些是我的文字和文字:
为了创建条件频率分布,我想创建一个看起来像 lot = [('text1', 'blood'), ('text1', 'young'), ... ('text2' , '血液'), ...)
我试图创造很多这样的:
而不是 lot = ('text1', 'blood') etc. 而不是 'text1' 是列表中的整个文本。
如何创建用于条件频率分布函数的元组列表?
python - Python中遵循线性下降分布的随机数
我想生成遵循下降线性频率分布的随机数,以 n=1-x 为例。
然而,numpy 库似乎只提供更复杂的分布。
python - 频率分布比较 Python
我正在使用 python 和 nltk 来研究一些文本,我想比较不同文本中词性的频率分布。
我可以为一个文本做到这一点:
我试图添加另一个,但没有太多运气。我有条件频率分布示例,用于比较多个文本中三个单词的计数,但我希望这些行代表四个不同的文本,y 轴代表计数,x 轴代表不同的文本词性。如何比较同一图表中的文本 Y 和 Z?
r - 有没有办法让 R 中的密度()函数使用计数与概率?
有没有办法让 R 中的密度()函数使用计数与概率?
例如,在使用直方图函数检查密度分布时,我有两个选项hist
:
我想知道是否有办法使用该density
功能做类似的事情?
在我的具体示例中,我计算了不同直径的树木。(我会注意到,我将数据保留为连续的大小比例,而不是将它们集中到离散的大小类别中)。当我对density
这些数据(即plot(density(dat$D,na.rm=T,from=0))
)使用函数时,它为我提供了每种尺寸概率的密度估计(当然是平滑的)。我更有兴趣将这些数据报告为茎/面积与概率,所以我更喜欢密度估计来使用计数。
想法??
更新:
以下是一些真实的示例数据:
这里尝试尝试@eipi10建议的方法:
此代码创建以下 2 个图 [标题为post-hoc ]:
如您所见,这两种方法在 y 轴上产生了不同的值。换句话说,@eipi10 的方法对我不起作用:(。