问题标签 [cumulative-frequency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
344 浏览

timestamp - 如何在 Power BI 中为累积计数创建列?

我正在尝试在表中创建一个新列,例如此处的最后一列: 在此处输入图像描述

我可以根据时间戳计算添加到购物篮中的同一类别的累积产品。我尝试分组并添加索引列,但时间戳非常重要(如第 7 行和第 8 行所示),我希望重置计数,因为它们与类别 1(Cat1)中的其他产品不连续。

谢谢你的帮助

0 投票
1 回答
383 浏览

r - ggplot中正常拟合的置信区间,累积概率

编辑:对不起,我是社区的新手。我尝试通过示例数据和代码使其更加清晰。

这是数据(dput的输出):

现在我使用过滤器对数据进行分类。我不确定这是否是明智的做法,但到​​目前为止有效。首先,两个类别有 1 和 3 两种大小,然后每个大小分为两种类型:A 和 B。所以最后我们有 4 种数据。

现在这是绘制 4 个不同类别的累积概率的代码。然后我习惯stat_function将高斯分布拟合添加到每个累积图。

  1. 现在我的问题是如何将 99%、95% 和 90%(带)的置信区间添加到高斯拟合中?(不是经验累积的)。
  2. 其次,如何将误差线添加到累积概率点?(到蓝点和蓝点)

到目前为止我的情节

到目前为止我的情节

0 投票
1 回答
162 浏览

r - 如何使用 ggplot2 创建分组累积频率图

我正在使用元素浓度数据集,我想比较两个地方元素浓度的累积频率图,就像我在 这张图片中使用 plot() 一样,但使用 ggplot。这是一个虚拟数据集

我设法以这种笨拙的方式为两个区域制作了一个累积频率图:

但我不知道如何分别为两个区域制作它。提前致谢。

0 投票
1 回答
454 浏览

r - 将 ECDF 图与辅助轴 ggplot 中的直方图相结合

我有一个收入变量。我想在一个带有两个 y 轴的图中制作直方图和累积分布的组合图。我得到了这个代码,

然后在我运行income它返回这个情节 在此处输入图像描述

就个人而言,对于这种情况,我在 R(没有 ggplot)中找到了一些类似的内置函数参考。但是,不知何故,我想改用 ggplot,希望以后能在更多情况下处理相同的语法模式。然后,我找到trans=~./max(data)了适用于 ggplot 的行。然后我把这个结果塞进了肚子里。

非常感谢

0 投票
1 回答
160 浏览

python - 在 Python 中使用导出的数据绘制累积直方图

我正在尝试绘制类似于下图的累积直方图。它显示了从单词 0 到 92,633 表示的文本语料库(x 轴)中法语代词“vous”的出现次数(y 轴)。它是使用名为TXM的语料库分析应用程序创建的。然而,TXM 的情节并不适合我的出版商的具体要求。我想制作自己的图,将数据导出到 python。问题是 TXM 导出的数据有点令人费解,我想知道如何使用它来制作绘图:它是一个包含整数的单列 txt 文件。

它们中的每一个都表示“vous”在文本语料库中的位置。Word 2620 是一个“vous”,3376,另一个等等。我对 Matplotlib 的尝试之一:

但这并不接近。我应该遵循哪些步骤来完成情节?

想要的情节:

想要的情节

0 投票
1 回答
73 浏览

sql - SQL中的累积计数

我正在努力编写一个查询来获取列中值的累积不同计数。

解释:

row 1有值a,没有前面的行有值a所以我们计数a一次并得到1

row 2有值b,没有前面的行有值b所以我们计数b一次并得到1

row 3有值c,没有前面的行有值c所以我们计数c一次并得到1

row 4有值c,前面有 1 行有值c,所以我们计数c两次并得到2

row 5有值c,前面有 2 行有值c,所以我们计数c三次并得到3

row 6有值a,前面有 1 行有值a,所以我们计数a两次并得到2

row 7有值a,前面有 2 行有值a,所以我们计数a三次并得到3

任何帮助都会很棒!

0 投票
1 回答
44 浏览

r - 重新格式化累积数据

我有累积家庭的数据,对照他们拥有的累积财富。我附上了少量数据的图像。使用 Rdiff()函数可以让我得到多少家庭拥有多少财富,这是好的。
我的目标是找到我的数据的基尼指数,我首先需要以家庭分布均匀的格式获取该指数。大约有 20000 行,这意味着我需要将拥有的财富一次标准化为 0.005% 或类似的东西,以便实现与家庭(1,2 等)而不是家庭百分比的真实财富分配。

图片

编辑:


使用https://ocr.space/进行数据 OCR :

0 投票
1 回答
185 浏览

r - 对于这个问题,如何在 R 中构建直方图、条形图、频率曲线和 Ogive 曲线?

Tillman 博士是 Socastee 大学商学院院长。他希望准备一份报告,显示学生每周学习的小时数。他随机抽取 30 名学生作为样本,并确定每个学生上周学习的小时数。
15.0,23.7,19.7,15.4,18.3,23.0,14.2,20.8,20.8,20.5,20.7,17.4,18.6,12.9,20.9,20.3,13.7,21.4,21.4,18.3,18.3,29.8,29.8,17.1,17.1,18.9 33.8、23.2、12.9、27.1、16.6

我使用 R 代码尝试了直方图,如下所示:

我也试过这样的条形图:

但我无法为“频率曲线”和“Ogive 曲线”编码。我如何在 R 中为这些代码编写代码?

谢谢!

0 投票
1 回答
31 浏览

r - 从开始时间的密度来看正在进行的事件的密度

我有一个数据框,其中包含一列事件 A 的开始时间和事件 A 的长度(以小时为单位),如下所示:

实际上,df 包含数千条记录。我想计算正在进行的事件数量的密度(或直方图 - 但密度更有意义,因为在每个时间增量中都有很多事件) 。因此,例如,在 8.02 开始的事件中,持续时间为 1 小时,则此记录会在 8.03、8.04...9.02 提供一个正在进行的操作计数。每条记录同样贡献了很多次。

解决这个问题的最佳方法是什么?

0 投票
2 回答
75 浏览

r - 我的累积百分比函数需要 R 帮助

最近的更改(无论是在 R 中还是在其他地方)使我以前的工作功能停止工作。该函数旨在生成两列,告诉我百分位数是多少(请参阅df2$CumPercent调查中的给定分数(请参阅 参考资料df2$V1)。因此,我对逻辑的手动版本进行了一些更改,效果很好。当我在一个函数中应用相同的逻辑,它吐出一个错误,指出Var1找不到变量。任何想法这里可能出了什么问题?