问题标签 [cumulative-frequency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
861 浏览

python - Matplotlib:避免 X 轴拥塞

我正在使用此代码绘制累积频率图:

它的外观如下,并且在初始部分周围非常拥挤。这是由于我的数据传播。我怎样才能让它更清楚?(上传到 postimg 因为我没有足够的声望点)

http://postimg.org/image/ii5z4czld/

0 投票
1 回答
2844 浏览

r - 在 r 中展开频率表

大家好,我正在努力解决我认为应该很容易的事情。

我有一个如下所示的数据集

我只需要一个根据计数复制行的函数。所以我最终会得到一个有 13 行的新数据框或数据表。

我正在尝试使用该rep()功能来执行此操作,但它不起作用。

0 投票
1 回答
9217 浏览

python - 在 matplotlib 中获取逆序累积直方图的技巧

我想知道是否有(更好的)技巧来反转 matplotlib 中的累积直方图。

假设我有一些分数在 0.0 到 1.0 之间,其中 1.0 是最好的分数。现在,我有兴趣绘制有多少样本高于某个分数阈值。

在此处输入图像描述

默认情况下,matplotlib 将绘制累积直方图,如“样本数 <= 分数”

在此处输入图像描述

我真正想要的是累积直方图不显示“样本数 <= 分数”而是“样本数 >= 分数”

我可以这样做,但是我将如何摆脱 x 轴上的“减号”符号?

在此处输入图像描述

有更好的想法吗?

0 投票
2 回答
1241 浏览

apache-spark - Spark:从频率值中获取累积频率

我的问题在单节点环境中回答起来相当简单,但我不知道如何在分布式 Spark 环境中做同样的事情。我现在拥有的是一个“频率图”,其中对于每个项目我都有它出现的次数。例如,它可能是这样的: (1, 2), (2, 3), (3,1)这意味着 1 发生了 2 次,2 发生了 3 次等等。

我想得到的是每个项目的累积频率,所以我需要从上面的实例数据中得到的结果是:(1, 2), (2, 3+2=5), (3, 1+3+2=6).

到目前为止,我已经尝试通过使用mapPartitionswhich 如果只有一个分区会给出正确的结果来做到这一点......否则显然不会。

我怎样才能做到这一点?

谢谢。马可

0 投票
4 回答
2170 浏览

c++ - 如何在数组中找到给定数字的频率?

问题是:给定一个大小为N的数组。还给定q =查询数;在查询中,您将得到l = 下限,u = 上限和num = 您必须将频率计入 l~u 的数量。

我在 C++ 中实现了我的代码,如下所示:

但是我的代码有一个问题,在每个查询中它不会使地图m为空。这就是为什么如果我两次/三次查询相同的数字,它会将频率计数与前一个存储的计数相加。

我该如何解决这个问题?对于 10^5 的大范围查询,它会是一个糟糕的程序吗?这个问题的有效解决方案是什么?

0 投票
0 回答
68 浏览

r - 具有 2 个 Y 轴、1 个频率、1 个累积频率的直方图%

我尝试生成带有 2 个 Y 轴的直方图。1 个带有频率的 Y 轴和 1 个带有累积频率的 Y 轴,以 % 为单位。这是我能得到的最接近的,但在轴上绘制多个标签时有点混乱,轴 4 格式不正确

提前感谢您的帮助,

0 投票
1 回答
64 浏览

r - 从已排序的数据框中绘制最接近的值到未排序的数据框中

我有两个数据框R。第一个数据帧是cumFreqDist具有相关周期的累积频率分布 ( )。数据框的第一行如下所示:

第二个数据帧是 10000 从runif分布中抽取,使用代码:

对于 中的每一行testData,我想找到相应cumfreq的 incumFreqDist并将相应的Time值添加到 中的新列中testData。因为testData是代表真实数据框的测试数据框,所以我不想排序testData

因为我正在处理累积频率,所以如果该值testData是应该返回的值是. 也就是说,我需要找到不超过该值的最接近的值,并且只返回那个值。23.30...Time8cumfreqtestData

data.table软件包已针对其他类似问题被提及,但我有限的理解是,该软件包需要在两个数据框中(转换为数据表后)中识别一个键,并且我不能假设这些testData值满足分配的要求作为一个键 - 似乎分配一个键将对数据进行排序。当我稍后在我正在做的进一步工作中设置种子时,这会给我带来问题。

0 投票
1 回答
915 浏览

vba - 我正在尝试在 VBA 中制作累积分布图

第一次海报。为了制作这个累积分布图,我制作了一个直线 xy 散点图。y 轴值是百分位数,所有这些值都在 A2:A100 中。相应的 x 值在 B 到 n 列中。n 是可变的,因为它取决于用户为创建图表指定了多少模拟策略。我需要 VBA 代码来创建一个 xy 散点图,其中 A2:A100 是位于相邻列中的所有 x 值系列的 y 值。一个命名单元,cumulativeColumns 计算具有 x 值的列数。基于我对 SeriesCollections 似乎如何工作的研究,我的第一个想法是使用 Do Until 循环,该循环将根据累积列公式的结果停止。我认为这段代码会起作用:

第一次通过循环 q = 1,因此第一个系列将获得 Col B 数据。第二次通过循环 q = 2,所以我认为将定义第二个系列并获取 C 列中的数据,等等,直到根据累积列值的结果没有更多包含数据的列时它停止。但我收到错误 1004,应用程序定义或对象定义错误。

0 投票
2 回答
146 浏览

r - 动态计数

R 纽布。我的数据的小代表。

想象一下,这是一个有数千场比赛的赛季的前四场比赛。对于主队和客队,我想计算主场、客场和总数的累计比赛数。因此,主队和客队都有 3 个新栏目。我想得到这样的东西(在这种情况下,我只计算主队的新变量):

为了计算第一列(HomeTeamGamesPlayedatHome),我设法做到了:

但是感觉太复杂了,我也无法用这种方法计算其他列。

我还想过使用公式表来计算出现次数:

但它只是计算总数,我想要任何给定时间点的结果。谢谢!

0 投票
1 回答
1129 浏览

sql - 需要按时期(年,月)区分累积计数

我已经设法按月获得累积的不同计数,但在尝试按年计算时却无法获得。我尝试了分区功能,但我不断收到各种错误,这就是我到目前为止所得到的。你能给我一些指导吗,我是新手。

[SQL 小提琴][1]

PostgreSQL 9.3 模式设置

查询 1

[结果][2]


[预期结果][2]