问题标签 [frequency-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
3878 浏览

r - R中Zipf(频率与等级)图的命令是什么

我有来自网络流量数据、数据量(字节数)和一周内源和目标 IP 对的流数。我想绘制分布,即频率与排名。我相信 R 已经为此提供了一个功能。它是什么以及如何在我的场景中使用该功能。

0 投票
4 回答
21240 浏览

sql - 在 Oracle 中创建直方图/频率分布的最佳方法?

我有一个events包含两列eventkey(唯一、主键)和的表createtime,它将事件的创建时间存储为自 1970 年 1 月 1 日以来的毫秒数NUMBER

我想创建一个“直方图”或频率分布,显示过去一周的每个小时内创建了多少事件。

width_bucket()这是使用该函数在 Oracle 中编写此类查询的最佳方法吗?是否可以使用其他 Oracle 分析函数之一导出落入每个存储桶的行数,而不是使用width_bucket来确定每行属于哪个存储桶编号并count(*)对其进行处理?

0 投票
2 回答
10856 浏览

python - 使用 NLTK 的 FreqDist

我正在尝试使用 Python 获取一组文档的频率分布。我的代码由于某种原因无法正常工作并产生此错误:

你能帮我吗?

这是到目前为止的代码:

0 投票
2 回答
5150 浏览

c# - 在 C# 中计算数组频率分布的最快方法是什么?

我只是想知道该计算的最佳方法是什么。假设我有一个输入值数组和边界数组 - 我想计算/分桶边界数组中每个段的频率分布。

使用存储桶搜索是个好主意吗?

实际上我发现了Calculating frequency distribution of a collection with .Net/C# 的问题

但是我不明白如何为此目的使用存储桶,因为在我的情况下每个存储桶的大小可能会有所不同。

编辑:在所有讨论之后,我有内/外循环解决方案,但我仍然想用字典消除内循环以获得 O(n) 性能,如果我理解正确,我需要将输入值散列到存储桶索引中. 所以我们需要某种复杂度为 O(1) 的散列函数?任何想法如何做到这一点?

0 投票
2 回答
305 浏览

java - 提取频率发生的时间

我取了一个歌曲样本并对样​​本执行 FFT(快速傅里叶变换)。我能够获得歌曲的频率,但无法获得这些频率出现的时间。因此,它基本上变得无用,因为我必须将它与不同的样本进行匹配,除非我从中获得时间信息。

我该如何进行?

0 投票
1 回答
5667 浏览

r - R中同一图表上的频率和累积频率曲线

有没有办法(在 R 中使用 ggplot 或其他方式)在单列(两行)中绘制频率和累积频率曲线,即在另一列的顶部,以便可以使用直线在两条曲线上显示给定的四分位数?我希望我清楚这一点..

您可以使用这些数据..

0 投票
1 回答
3354 浏览

python - Python 频率分布 (FreqDist / NLTK) 问题

我正在尝试将单词列表(标记化字符串)分解为每个可能的子字符串。然后我想对每个子字符串运行一个 FreqDist,以找到最常见的子字符串。第一部分工作正常。但是,当我运行 FreqDist 时,出现错误:

这是我的代码:

的输出substrings很好。这里是:

但是,我就是无法让 FreqDist 在其上运行。任何见解将不胜感激。在这种情况下,每个子字符串的 FreqDist 仅为 1,但该程序旨在在更大的文本样本上运行。

0 投票
1 回答
85 浏览

php - 编码用户选择日期重复出现的界面

我需要创建一个界面,用户需要选择他的杂志/报纸分发多少次。一些杂志/报纸得到分发

  • 一周几次。
  • 一个月几次:--按天(例如每隔一个星期二)或按日期(例如在 1 日、10 日和 28 日)
  • 一年几次。

选择频率后,我需要为每个频率项添加附加信息。例如,如果用户在星期一和星期五选择每周,我需要为星期一添加附加信息,并为星期五添加单独的信息。

有人对如何做到这一点有任何想法吗?或者我可以在哪里阅读更多内容或获取一些示例?

我为此应用程序使用 PHP 和 javascript/jquery。

提前致谢。

0 投票
2 回答
1867 浏览

python - Python NLTK FreqDist() 通过将 k,v 写入磁盘来减少内存使用?

我有一个小程序,它使用 NLTK 来获取相当大的数据集的频率分布。问题是,几百万字之后,我开始耗尽系统上的所有 RAM。这是我认为相关的代码行:

必须有一种方法可以将密钥、值存储写入磁盘,我只是不确定如何。我试图远离像 MongoDB 这样的文档存储并保持纯粹的 Python 风格。如果有人有一些建议,我将不胜感激。

0 投票
1 回答
154 浏览

python - 如何有效地处理频率分布计算的数据库查询?

我已经为此工作了一段时间,试图创建一个频率分布数据库端:

(哇,测试用例的 180 行代码库减少到 37 行!:D - 请注意,实际的单词列表是 2900 万而不是 4 !!!)

我意识到:

  • 我不应该update_freq_dist在内循环中需要两个查询
  • 有一种方法可以遍历数据库元素(行),例如:一次 5 个

但是我不确定如何解决这两个问题。

你能想出解决办法吗?