“cumulative-frequency”的相关标签问题

0 投票

1 回答

344 浏览

timestamp - 如何在 Power BI 中为累积计数创建列？

我正在尝试在表中创建一个新列，例如此处的最后一列：

我可以根据时间戳计算添加到购物篮中的同一类别的累积产品。我尝试分组并添加索引列，但时间戳非常重要（如第 7 行和第 8 行所示），我希望重置计数，因为它们与类别 1（Cat1）中的其他产品不连续。

谢谢你的帮助

2020-04-16T17:35:24.357

0 投票

1 回答

383 浏览

r - ggplot中正常拟合的置信区间，累积概率

编辑：对不起，我是社区的新手。我尝试通过示例数据和代码使其更加清晰。

这是数据（dput的输出）：

现在我使用过滤器对数据进行分类。我不确定这是否是明智的做法，但到目前为止有效。首先，两个类别有 1 和 3 两种大小，然后每个大小分为两种类型：A 和 B。所以最后我们有 4 种数据。

现在这是绘制 4 个不同类别的累积概率的代码。然后我习惯stat_function将高斯分布拟合添加到每个累积图。

现在我的问题是如何将 99%、95% 和 90%（带）的置信区间添加到高斯拟合中？（不是经验累积的）。
其次，如何将误差线添加到累积概率点？（到蓝点和蓝点）

到目前为止我的情节

r ggplot2 confidence-interval cumulative-frequency

2020-04-23T11:02:33.100

0 投票

1 回答

162 浏览

r - 如何使用 ggplot2 创建分组累积频率图

我正在使用元素浓度数据集，我想比较两个地方元素浓度的累积频率图，就像我在这张图片中使用 plot() 一样，但使用 ggplot。这是一个虚拟数据集

我设法以这种笨拙的方式为两个区域制作了一个累积频率图：

但我不知道如何分别为两个区域制作它。提前致谢。

r ggplot2 cumulative-frequency

2020-05-08T10:40:13.953

0 投票

1 回答

454 浏览

r - 将 ECDF 图与辅助轴 ggplot 中的直方图相结合

我有一个收入变量。我想在一个带有两个 y 轴的图中制作直方图和累积分布的组合图。我得到了这个代码，

然后在我运行income它返回这个情节

就个人而言，对于这种情况，我在 R（没有 ggplot）中找到了一些类似的内置函数参考。但是，不知何故，我想改用 ggplot，希望以后能在更多情况下处理相同的语法模式。然后，我找到trans=~./max(data)了适用于 ggplot 的行。然后我把这个结果塞进了肚子里。

非常感谢

r ggplot2 ecdf cumulative-frequency

2020-05-18T05:17:30.117

0 投票

1 回答

160 浏览

python - 在 Python 中使用导出的数据绘制累积直方图

我正在尝试绘制类似于下图的累积直方图。它显示了从单词 0 到 92,633 表示的文本语料库（x 轴）中法语代词“vous”的出现次数（y 轴）。它是使用名为TXM的语料库分析应用程序创建的。然而，TXM 的情节并不适合我的出版商的具体要求。我想制作自己的图，将数据导出到 python。问题是 TXM 导出的数据有点令人费解，我想知道如何使用它来制作绘图：它是一个包含整数的单列 txt 文件。

它们中的每一个都表示“vous”在文本语料库中的位置。Word 2620 是一个“vous”，3376，另一个等等。我对 Matplotlib 的尝试之一：

但这并不接近。我应该遵循哪些步骤来完成情节？

想要的情节：

想要的情节

python matplotlib cumulative-frequency

2020-05-31T18:56:37.667

0 投票

1 回答

73 浏览

sql - SQL中的累积计数

我正在努力编写一个查询来获取列中值的累积不同计数。

解释：

row 1有值a，没有前面的行有值a所以我们计数a一次并得到1。

row 2有值b，没有前面的行有值b所以我们计数b一次并得到1。

row 3有值c，没有前面的行有值c所以我们计数c一次并得到1。

row 4有值c，前面有 1 行有值c，所以我们计数c两次并得到2。

row 5有值c，前面有 2 行有值c，所以我们计数c三次并得到3。

row 6有值a，前面有 1 行有值a，所以我们计数a两次并得到2。

row 7有值a，前面有 2 行有值a，所以我们计数a三次并得到3。

任何帮助都会很棒！

sql distinct cumulative-frequency

2020-06-18T04:29:03.253

0 投票

1 回答

44 浏览

r - 重新格式化累积数据

我有累积家庭的数据，对照他们拥有的累积财富。我附上了少量数据的图像。使用 Rdiff()函数可以让我得到多少家庭拥有多少财富，这是好的。
我的目标是找到我的数据的基尼指数，我首先需要以家庭分布均匀的格式获取该指数。大约有 20000 行，这意味着我需要将拥有的财富一次标准化为 0.005% 或类似的东西，以便实现与家庭（1,2 等）而不是家庭百分比的真实财富分配。

编辑：

使用https://ocr.space/进行数据 OCR ：

r statistics cumulative-frequency

2020-07-06T17:43:07.733

0 投票

1 回答

185 浏览

r - 对于这个问题，如何在 R 中构建直方图、条形图、频率曲线和 Ogive 曲线？

Tillman 博士是 Socastee 大学商学院院长。他希望准备一份报告，显示学生每周学习的小时数。他随机抽取 30 名学生作为样本，并确定每个学生上周学习的小时数。
15.0，23.7，19.7，15.4，18.3，23.0，14.2，20.8，20.8，20.5，20.7，17.4，18.6，12.9，20.9，20.3，13.7，21.4，21.4，18.3，18.3，29.8，29.8，17.1，17.1，18.9 33.8、23.2、12.9、27.1、16.6

我使用 R 代码尝试了直方图，如下所示：

我也试过这样的条形图：

但我无法为“频率曲线”和“Ogive 曲线”编码。我如何在 R 中为这些代码编写代码？

谢谢！

r graph statistics histogram cumulative-frequency

2020-07-10T14:21:23.580

0 投票

1 回答

31 浏览

r - 从开始时间的密度来看正在进行的事件的密度

我有一个数据框，其中包含一列事件 A 的开始时间和事件 A 的长度（以小时为单位），如下所示：

实际上，df 包含数千条记录。我想计算正在进行的事件数量的密度（或直方图 - 但密度更有意义，因为在每个时间增量中都有很多事件）。因此，例如，在 8.02 开始的事件中，持续时间为 1 小时，则此记录会在 8.03、8.04...9.02 提供一个正在进行的操作计数。每条记录同样贡献了很多次。

解决这个问题的最佳方法是什么？

r cumulative-frequency

2020-10-16T12:11:43.613

0 投票

2 回答

75 浏览

r - 我的累积百分比函数需要 R 帮助

最近的更改（无论是在 R 中还是在其他地方）使我以前的工作功能停止工作。该函数旨在生成两列，告诉我百分位数是多少（请参阅df2$CumPercent调查中的给定分数（请参阅参考资料df2$V1）。因此，我对逻辑的手动版本进行了一些更改，效果很好。当我在一个函数中应用相同的逻辑，它吐出一个错误，指出Var1找不到变量。任何想法这里可能出了什么问题？

r function cumulative-frequency

2020-11-11T10:28:55.780

问题标签 [cumulative-frequency]

Reference