问题标签 [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在R中处理调查多项选择数据
我需要分析调查数据以获取多问题变量的频率。我正在使用这个 R 包
我知道我需要使用“multi.split”函数来创建我将使用的变量。但我需要知道如何让它参考不在数据集中的答案,这意味着答案是原始问题的一部分,但在调查期间没有选择,因此应该以值 0 显示。
示例:我有以下可以接受的答案:
我的数据是(如示例中):
当我运行这个命令时:
我得到以下结果:
但我想得到:
关于我该怎么做的任何想法?
histogram - NetLogo:直方图相对频率
我仍然遇到问题[histogram]
。
我有一个全局变量(age-sick),它存储海龟生病时的年龄......我想绘制分布:histogram age-sick
但是,我不想要每个年龄段生病的海龟的绝对数量,而是相对数量。有没有办法这样做?
python - 拆分 CSV 后应用 nltk.FreqDist
我一直在尝试使用具有|
分隔符和\n
换行符的数据集。
a | b | c
c | e | f
我一直在尝试拆分集合rec[0].split('|')
并应用nltk.FreqDist(rec)
这是我的源代码
我得到的输出如下
我期待的是
谁能指出我在哪里搞砸了?任何建议都会有所帮助:)
PS - 我什至用过csv
,但没有运气
python - matlab中是否有与NDhist等效的python?
这是 Matlab 函数的链接,我想知道是否有人在 python 中遇到过类似的东西。我想输入相同长度的 X 和 Y 数组并生成本质上是热图的内容。坐标落入 bin 的频率决定了该 bin 的颜色。
非常感谢任何帮助或有关如何以不同方式执行此操作的建议!
plyr - R中的频率表
我正在与我认为应该如此简单的事情作斗争!我研究了 R 中的频率表,但不知道该怎么做。
我有一个数据集,其中包含不同的问卷。即,第一份问卷由 10 个项目组成,每个项目/变量都有一个单独的列,即问题 1、问题 2、问题 3 等各有其自己的列。
在每一列中,有 400 个响应(即参与者),其中每个参与者给出的响应为 0、1 或 2。
我要做的就是对所有变量(即问题 1、问题 2、问题 3 等)生成频率计数,以便获得所有变量的摘要 - 例如:
“问题 1”
0 = 100
1 = 200
2 = 97
NA = 3
总计 = 400
如何在一个简单、整洁的表格中生成它?
matlab - 如何将不规则波变为傅里叶级数
我制作了由 16 个具有随机相位差的规则波组成的不规则波。此外,我试图将不规则波分成几个波,它们是傅立叶级数的形式。所以我在第 11 行下面编写了代码。但是当我运行这段代码时,即使 20 分钟后我也无法得到结果。需要很长时间才能得到结果也让我担心,但更大的问题是我不确定结果是否正确。如何将“不规则波”转换为“傅立叶级数”?
r - R中具有加权数据的组频率表
我希望用加权数据按组计算两种频率表。
您可以使用以下代码生成可重现的数据:
首先,我尝试按国家和年份计算移民身份(本地 VS 外国出生)的频率表。questionr
我使用包和编写了以下代码plyr
:
在我的真实数据库中,我有 10 年,所以多年来应用此代码需要时间。有谁知道更快的方法吗?
我还想按国家和年份计算女性和男性在移民身份中的比例。我正在寻找类似的东西:
有谁知道我怎样才能得到这些结果?
string - 在python中查找数字列表的频率分布
我有一长串数字,如下所示。我想找到每个数字的频率分布,但我无法使用 Counter 函数来获取每个项目的频率,因为它们是整数并且我得到它不可迭代的错误,因此我无法将列表转换为字符串. 我检查了类似的问题,但它们对我不起作用。
apache-spark - spark dataset API:找出每个用户的设备使用分布以及其他聚合
下面是我的数据集。
我想找出每个用户的以下聚合。
有人可以帮助我最好在 Java 中使用 spark 2.0 API 来实现这一点。我曾尝试使用 UserDefinedAggregateFunction,但它不支持组内组,因为我必须按设备对每个用户组进行分组,以查找在每个设备上花费的汇总时间。