问题标签 [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中Zipf(频率与等级)图的命令是什么
我有来自网络流量数据、数据量(字节数)和一周内源和目标 IP 对的流数。我想绘制分布,即频率与排名。我相信 R 已经为此提供了一个功能。它是什么以及如何在我的场景中使用该功能。
sql - 在 Oracle 中创建直方图/频率分布的最佳方法?
我有一个events
包含两列eventkey
(唯一、主键)和的表createtime
,它将事件的创建时间存储为自 1970 年 1 月 1 日以来的毫秒数NUMBER
。
我想创建一个“直方图”或频率分布,显示过去一周的每个小时内创建了多少事件。
width_bucket()
这是使用该函数在 Oracle 中编写此类查询的最佳方法吗?是否可以使用其他 Oracle 分析函数之一导出落入每个存储桶的行数,而不是使用width_bucket
来确定每行属于哪个存储桶编号并count(*)
对其进行处理?
python - 使用 NLTK 的 FreqDist
我正在尝试使用 Python 获取一组文档的频率分布。我的代码由于某种原因无法正常工作并产生此错误:
你能帮我吗?
这是到目前为止的代码:
c# - 在 C# 中计算数组频率分布的最快方法是什么?
我只是想知道该计算的最佳方法是什么。假设我有一个输入值数组和边界数组 - 我想计算/分桶边界数组中每个段的频率分布。
使用存储桶搜索是个好主意吗?
实际上我发现了Calculating frequency distribution of a collection with .Net/C# 的问题
但是我不明白如何为此目的使用存储桶,因为在我的情况下每个存储桶的大小可能会有所不同。
编辑:在所有讨论之后,我有内/外循环解决方案,但我仍然想用字典消除内循环以获得 O(n) 性能,如果我理解正确,我需要将输入值散列到存储桶索引中. 所以我们需要某种复杂度为 O(1) 的散列函数?任何想法如何做到这一点?
java - 提取频率发生的时间
我取了一个歌曲样本并对样本执行 FFT(快速傅里叶变换)。我能够获得歌曲的频率,但无法获得这些频率出现的时间。因此,它基本上变得无用,因为我必须将它与不同的样本进行匹配,除非我从中获得时间信息。
我该如何进行?
r - R中同一图表上的频率和累积频率曲线
有没有办法(在 R 中使用 ggplot 或其他方式)在单列(两行)中绘制频率和累积频率曲线,即在另一列的顶部,以便可以使用直线在两条曲线上显示给定的四分位数?我希望我清楚这一点..
您可以使用这些数据..
python - Python 频率分布 (FreqDist / NLTK) 问题
我正在尝试将单词列表(标记化字符串)分解为每个可能的子字符串。然后我想对每个子字符串运行一个 FreqDist,以找到最常见的子字符串。第一部分工作正常。但是,当我运行 FreqDist 时,出现错误:
这是我的代码:
的输出substrings
很好。这里是:
但是,我就是无法让 FreqDist 在其上运行。任何见解将不胜感激。在这种情况下,每个子字符串的 FreqDist 仅为 1,但该程序旨在在更大的文本样本上运行。
php - 编码用户选择日期重复出现的界面
我需要创建一个界面,用户需要选择他的杂志/报纸分发多少次。一些杂志/报纸得到分发
- 一周几次。
- 一个月几次:--按天(例如每隔一个星期二)或按日期(例如在 1 日、10 日和 28 日)
- 一年几次。
选择频率后,我需要为每个频率项添加附加信息。例如,如果用户在星期一和星期五选择每周,我需要为星期一添加附加信息,并为星期五添加单独的信息。
有人对如何做到这一点有任何想法吗?或者我可以在哪里阅读更多内容或获取一些示例?
我为此应用程序使用 PHP 和 javascript/jquery。
提前致谢。
python - Python NLTK FreqDist() 通过将 k,v 写入磁盘来减少内存使用?
我有一个小程序,它使用 NLTK 来获取相当大的数据集的频率分布。问题是,几百万字之后,我开始耗尽系统上的所有 RAM。这是我认为相关的代码行:
必须有一种方法可以将密钥、值存储写入磁盘,我只是不确定如何。我试图远离像 MongoDB 这样的文档存储并保持纯粹的 Python 风格。如果有人有一些建议,我将不胜感激。
python - 如何有效地处理频率分布计算的数据库查询?
我已经为此工作了一段时间,试图创建一个频率分布数据库端:
(哇,测试用例的 180 行代码库减少到 37 行!:D - 请注意,实际的单词列表是 2900 万而不是 4 !!!)
我意识到:
- 我不应该
update_freq_dist
在内循环中需要两个查询 - 有一种方法可以遍历数据库元素(行),例如:一次 5 个
但是我不确定如何解决这两个问题。
你能想出解决办法吗?