问题标签 [frequency-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
9832 浏览

matlab - 矩阵中元素的频率 - Matlab

从我在 matlab 中运行的函数中,我得到一个 225x400 矩阵。我想计算这个矩阵中每个元素的频率,这意味着我需要计算每个元素出现在矩阵上的次数。我的矩阵名称是“Idiff”

我在用:

找出 Idiff 矩阵中的唯一元素。我收到一列 1138 个元素,所以我知道这些元素是唯一的,并且 Idiff 矩阵中的所有其他元素都是重复的这些元素。

现在我尝试使用以下方法计算每个唯一元素在我的 Idiff 矩阵中出现的次数:

但我得到的是一列 47761 个元素,我很困惑。

你能帮助我吗?

0 投票
1 回答
2142 浏览

mysql - 获取大型 MySql 表中值频率分布的有效方法

我有两张桌子,即。Total_DataDistinct_S1

Total_Data有 350 万行。字段:“S1”、“S2”、“S3”、“S4”

Distinct_S1有 100 万行。字段:“S1”、“频率”。Distinct_S1的“ S1”由Total_Data的“S1”中出现的所有不同值组成。

手头的任务: Distinct_S1 for S1 = 'xxyy'的“频率” (假设)应该包括在Total_Data中出现 'xxyy' 的次数。

我在 python 脚本(导入 MySQLdb)中使用了以下查询来完成手头的任务:

上面的查询工作正常,但似乎需要很多时间。有没有其他更快的方法来达到同样的效果?

0 投票
1 回答
6180 浏览

r - R计算数据框中的百分比值

我今天的问题是指我在 R 中处理的一个数据框。数据框的标题如下所示:String(unique), Integer N[0-23]

这 24 个整数值表示与一天中的每个小时相关联的字符串的频率。从逻辑上讲,每行中的 int 值总和等于字符串在数据中出现的频率。

问题是,我不需要字符串在某个小时的实际频率,而是该频率代表的百分比相对于所有行中整数值的总和。

我的讲师暗示 table() 可能是正确的 R 工具,但老实说,我不明白这应该如何帮助我。

如果一切都失败了,我会用 Java 计算它——尽管我真的很感谢你在 R 中提供的帮助。

感谢您到目前为止的阅读,并提前感谢您的帮助,

瑞奇福克斯

@@@@@@我是你的编辑,读给我@@@@@@

在詹姆斯的帮助下,我得到了以下道具

问题是,每行的百分比总和为 100,但他们应该为整个表这样做。有没有办法做到这一点?

0 投票
2 回答
13266 浏览

r - 缩放/加权密度图

我想生成一个观察温度的密度图,该密度图按每个温度数据点观察到的事件数量进行缩放。我的数据包含两列:温度和[观察次数]。

现在,我有一个密度图,它只包含温度频率,根据:

如何缩放此密度以说明每个温度下的观察次数?例如,我希望能够看到按比例缩放的温度密度图,以显示在较高/较低温度下每个温度是否有更多/更少的观测值。

我想我正在寻找可以衡量温度的东西?

0 投票
4 回答
3615 浏览

python - 如何使用 python 内置的 map 和 reduce 函数计算字符串中的字母频率

我想使用 pythons map 和 reduce 内置函数计算字符串中字母的频率。谁能提供一些关于我如何做到这一点的见解?

到目前为止我得到了什么:

当所有字母都相同时,这很有效。

当有不同的字母时,如何让它正常工作?

0 投票
1 回答
279 浏览

r - 从直方图中应用函数 - 在 R 中

我对统计数据有非常基本的掌握,对 R 也有非常基本的掌握,所以请多多包涵。

我有调查数据,其中显示了一些受访者的每周支出。我已将其放入直方图中,并绘制了密度函数。到目前为止,一切都很好。

然后我如何将这条曲线应用于更大的人群?假设我知道我所在城镇的人口为 25000。如何将其应用于密度曲线以得出新的直方图及其背后的数据表?

我希望这是一个适当的问题,谢谢。

0 投票
2 回答
1108 浏览

c++ - 使用 C++ 中的最大似然法将 1000 个样本拟合到正态分布

我有5000个双打样本

样本 = {1.23, -4.67, 0.17, 1.25, 6.89, -2.03, ...}

并希望将数据拟合到参数分布,如 N(mu, sigma) 或广义学生 t(loc, scale, DoF)...

我已经有了这些分布 PDF_normal(mu, sigma)(x) 和 PDF_t(loc, scale, DoF)(x) 的 PDF,并且可以计算固定分布参数的 5000 个样本的 PDF 对数之和。

现在,我想使用一些 C++ 算法来解决非线性优化问题,以找到能够给出最大对数似然值的参数 (mu_max, sigma_max) 或 (loc_max, scale_max, DoF_max)。

用于统计计算的 R 项目正在通过以下方式解决 MASS 包中的问题:.. 使用 optim 执行对数似然的直接优化。估计的标准误差取自观察到的信息矩阵,通过数值近似计算。对于一维问题,使用 Nelder-Mead 方法,对于多维问题,使用 BFGS 方法...

不幸的是,我不能使用 R 解决方案,但必须在 Microsoft VS2010 C++ 中提出解决方案,我不想自己编写优化代码,也不想查看 R 源代码并为 C++ 重写它。 ..

有什么建议可以让我找到一个快速且经过良好测试的 C++ BFGS(或类似)实现吗?

Boost、Intel MKL 等有什么可用的吗?

谢谢你的帮助,马特

0 投票
1 回答
2908 浏览

json - 使用 JSON 数据在 d3 中绘制频率图

我正在 d3 中做一个项目,对于如何绘制频率图来绘制推文,我束手无策。所以,基本上,我有一个 JSON 文件,它的格式是这样的

所以,现在我需要在 d3 中绘制一个图表,显示特定时间段内的推文数量。例如,在日期 X 和日期 Y 之间,图表显示每天有多少条推文。

有人可以帮我解决这个问题吗?我对d3真的很陌生。

0 投票
1 回答
359 浏览

gnuplot - 关于创建针对大输入的频率分布

最近我需要创建一个直方图来显示大型数据集的频率分布。如果数据集很小,这应该是一项简单的工作。但是,我需要绘制的数据集包含大约 800000000 个数字(假设每个数字占用 4 个字节),它们都存储在一个文本文件中,每行一个数字。文本文件大约 4 GB。我尝试了 GNUPLOT,但它抱怨没有足够的内存来处理这个数据集。有人可以建议如何解决这个问题,或任何其他工具来完成这项工作吗?

谢谢,汤姆

0 投票
1 回答
2414 浏览

r - 频率分布的中位数

我想计算大量样本的频率分布的中位数。每个样本都有多个类别(示例中为 3 个)及其各自的频率。每个类都与不同的值相关联

例如,样本 1 的中位数为 19.5。我假设这可以使用quantile()每个样本的频率分布来完成,但所有尝试都失败了。

你有什么建议吗?