问题标签 [cumulative-frequency]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ggplot中正常拟合的置信区间,累积概率
编辑:对不起,我是社区的新手。我尝试通过示例数据和代码使其更加清晰。
这是数据(dput的输出):
现在我使用过滤器对数据进行分类。我不确定这是否是明智的做法,但到目前为止有效。首先,两个类别有 1 和 3 两种大小,然后每个大小分为两种类型:A 和 B。所以最后我们有 4 种数据。
现在这是绘制 4 个不同类别的累积概率的代码。然后我习惯stat_function
将高斯分布拟合添加到每个累积图。
- 现在我的问题是如何将 99%、95% 和 90%(带)的置信区间添加到高斯拟合中?(不是经验累积的)。
- 其次,如何将误差线添加到累积概率点?(到蓝点和蓝点)
到目前为止我的情节
r - 如何使用 ggplot2 创建分组累积频率图
我正在使用元素浓度数据集,我想比较两个地方元素浓度的累积频率图,就像我在 这张图片中使用 plot() 一样,但使用 ggplot。这是一个虚拟数据集
我设法以这种笨拙的方式为两个区域制作了一个累积频率图:
但我不知道如何分别为两个区域制作它。提前致谢。
python - 在 Python 中使用导出的数据绘制累积直方图
我正在尝试绘制类似于下图的累积直方图。它显示了从单词 0 到 92,633 表示的文本语料库(x 轴)中法语代词“vous”的出现次数(y 轴)。它是使用名为TXM的语料库分析应用程序创建的。然而,TXM 的情节并不适合我的出版商的具体要求。我想制作自己的图,将数据导出到 python。问题是 TXM 导出的数据有点令人费解,我想知道如何使用它来制作绘图:它是一个包含整数的单列 txt 文件。
它们中的每一个都表示“vous”在文本语料库中的位置。Word 2620 是一个“vous”,3376,另一个等等。我对 Matplotlib 的尝试之一:
但这并不接近。我应该遵循哪些步骤来完成情节?
想要的情节:
sql - SQL中的累积计数
我正在努力编写一个查询来获取列中值的累积不同计数。
解释:
row 1
有值a
,没有前面的行有值a
所以我们计数a
一次并得到1
。
row 2
有值b
,没有前面的行有值b
所以我们计数b
一次并得到1
。
row 3
有值c
,没有前面的行有值c
所以我们计数c
一次并得到1
。
row 4
有值c
,前面有 1 行有值c
,所以我们计数c
两次并得到2
。
row 5
有值c
,前面有 2 行有值c
,所以我们计数c
三次并得到3
。
row 6
有值a
,前面有 1 行有值a
,所以我们计数a
两次并得到2
。
row 7
有值a
,前面有 2 行有值a
,所以我们计数a
三次并得到3
。
任何帮助都会很棒!
r - 重新格式化累积数据
我有累积家庭的数据,对照他们拥有的累积财富。我附上了少量数据的图像。使用 Rdiff()
函数可以让我得到多少家庭拥有多少财富,这是好的。
我的目标是找到我的数据的基尼指数,我首先需要以家庭分布均匀的格式获取该指数。大约有 20000 行,这意味着我需要将拥有的财富一次标准化为 0.005% 或类似的东西,以便实现与家庭(1,2 等)而不是家庭百分比的真实财富分配。
编辑:
使用https://ocr.space/进行数据 OCR :
r - 对于这个问题,如何在 R 中构建直方图、条形图、频率曲线和 Ogive 曲线?
Tillman 博士是 Socastee 大学商学院院长。他希望准备一份报告,显示学生每周学习的小时数。他随机抽取 30 名学生作为样本,并确定每个学生上周学习的小时数。
15.0,23.7,19.7,15.4,18.3,23.0,14.2,20.8,20.8,20.5,20.7,17.4,18.6,12.9,20.9,20.3,13.7,21.4,21.4,18.3,18.3,29.8,29.8,17.1,17.1,18.9 33.8、23.2、12.9、27.1、16.6
我使用 R 代码尝试了直方图,如下所示:
我也试过这样的条形图:
但我无法为“频率曲线”和“Ogive 曲线”编码。我如何在 R 中为这些代码编写代码?
谢谢!
r - 从开始时间的密度来看正在进行的事件的密度
我有一个数据框,其中包含一列事件 A 的开始时间和事件 A 的长度(以小时为单位),如下所示:
实际上,df 包含数千条记录。我想计算正在进行的事件数量的密度(或直方图 - 但密度更有意义,因为在每个时间增量中都有很多事件) 。因此,例如,在 8.02 开始的事件中,持续时间为 1 小时,则此记录会在 8.03、8.04...9.02 提供一个正在进行的操作计数。每条记录同样贡献了很多次。
解决这个问题的最佳方法是什么?
r - 我的累积百分比函数需要 R 帮助
最近的更改(无论是在 R 中还是在其他地方)使我以前的工作功能停止工作。该函数旨在生成两列,告诉我百分位数是多少(请参阅df2$CumPercent
调查中的给定分数(请参阅 参考资料df2$V1
)。因此,我对逻辑的手动版本进行了一些更改,效果很好。当我在一个函数中应用相同的逻辑,它吐出一个错误,指出Var1
找不到变量。任何想法这里可能出了什么问题?