问题标签 [quantile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
865 浏览

octave - 八度分位数和百分位数

由于某种原因,我无法制作八度返回分位数。例子:

虽然我期望类似:

如果我尝试 prctile(a),也会发生同样的情况。那么,问题是什么?问候,赫尔博

0 投票
1 回答
1908 浏览

r - 计算大数据的分位数

我有大约 300 个文件,每个文件包含 1000 个时间序列实现(每个文件约 76 MB)。

我想从完整的 300000 个实现中计算每个时间步的分位数(0.05、0.50、0.95)。

我无法将实现合并到一个文件中,因为它会变得太大。

这样做最有效的方法是什么?

每个矩阵都是通过运行模型生成的,但是这里是一个包含随机数的示例:

0 投票
1 回答
1004 浏览

r - 标准正态分布的第 p 个分位数 - R

我正在从一本名为“使用 R 发现统计”的书中学习统计和 R……虽然它提供的信息非常丰富,但它似乎跳过了一些领域,即使它表明不需要统计或 R 的先验知识。那么问题来了:

如何使用二分法(或二分法)在 R 中计算标准正态分布的第 p 个分位数?(并假设不使用qnorm())。那是:

更新:

二分法是一种采用区间的方法,该区间[a,b]在区间的端点采用不同符号的值,并且x[a,b]. 然后你一半 if to find F(x1),如果f(x1) != 0它给你[a,x1]and [x1,b]... 序列x1, x2,...,收敛到的地方0

0 投票
3 回答
3199 浏览

r - 获取对应于每个四分位数的观察值

我得到以下结果,数据集是在 R 中提供的。

我想要一个包含数据的数据框和一个用于指出每个观测值所属的分位数的附加列。例如,最终数据集应如下所示

如何才能做到这一点?

0 投票
1 回答
402 浏览

python - SQLalchemy:列值组合的所有排列的分位数

我们有一个 sql server 查询,我们需要为越来越多的变量生成 ntile,以便变量以各种排列方式相互组合。这是一个摘录,可以说明我的意思:

声明1:

声明2:

声明 3:

您可以看到语句是相同的,除了在第二个和第三个中创建了斜体列“国家”和“用户类型”。所以我们在不同的特异性水平上为同一个变量“Objects_Created”取 ntiles,我们还必须为这些变量的各种可能排列取 ntiles,例如:

声明4:

我们可以手动对这些排列进行编码,但如果我们可以使用 sqlalchemy 来执行这些变量的所有排列,它可能会使事情变得更容易。有人有我可以重新使用的例子吗?

谢谢你的帮助!

0 投票
2 回答
4030 浏览

r - 如何通过 data.table 中的十分位组计算统计信息

我有一个 data.table 并想按组计算统计数据。

这些组应由

我如何计算b每个 bin 的平均值,比如b=-.5我是否[-0.61386923071,-0.37534201964]在 bin内3

0 投票
1 回答
214 浏览

r - 我应该如何在 R 中构建每个人的多个观察数据以计算 OLS 和分位数回归?

为了分析眼动追踪实验的数据,我使用 Matlab 对数据进行了预处理,现在我想在 R. OLS 回归和分位数回归中进行回归分析。

对于这种情况下的单个测试人员“vp31”,我是这样开始的:

正如上升的起始时间所反映的那样,我对每个人都有成功的观察。准确地说,我的数据现在看起来像这样:

然后我尝试计算回归:

希望我在这里做对了吗?我印象深刻,因为 R 很聪明,并且会自动对分类变量 Area of​​ Interest 进行虚拟编码。但是,有没有办法将参考级别设置为向量的第一个元素,包括感兴趣级别的名称?在这种情况下,我希望以 FMA 作为参考。

我还从 Matlab 中提取了一个带有测试人员姓名的向量,例如>

现在谈谈我更大的问题,我应该如何构建我的数据来计算多个测试人员的回归以及回归公式的样子?(不要混淆,我只是在这里用数字替换了 area 中的分类名称,因为这个示例是使用我的代码的旧版本生成的)

这是我的第一个 stackoverflow 请求,所以请不要对我苛刻 :) 期待您的意见,并提前感谢您的时间和帮助!弗洛里安

在做了越来越多的研究之后,我想知道我是否必须像这样构造我的数据?所以所有信息都排成一排?

0 投票
3 回答
2711 浏览

r - 在 R 中创建 QQ 图

我一直在尝试在 R 中创建一个 qq 图。我很难使用我的结果,所以我尝试遵循“遗传病例对照研究中的基本统计分析,Clarke 等人”中的示例。

步骤 5, a, iii) 我已将路径和模型替换为必填字段,如下所示:

这是我收到的错误消息:

我仍然在掌握这个软件,所以如果我忽略了一些明显的东西,任何帮助都将不胜感激和抱歉。汤姆

0 投票
2 回答
1878 浏览

r - R:QQ 图中的样本量注意事项

通常使用图形来评估给定样本的正态性。然而 QQ 图需要大样本量才能可靠地代表被抽样的总体。在一些文本中说,至少一千个样本量是可取的。这是描述这一点的示例 R 代码:

该代码产生以下内容:

在此处输入图像描述

问题1:我的样本有多大,比如理论上的-/+6 sigma?理论上,6 sigma 事件发生(正常 dist)发生 1 in 506797346 !你怎么看 ?

问题 2:无论样本大小,在极端值上总会有几个点偏离趋势线。这似乎是“正常”和预期的行为。有人可以发布背后的理由吗?

谢谢,里亚德

0 投票
1 回答
1869 浏览

r - 如何在 R 中创建分位数并绘制直方图

我最近开始使用 R。我有一个由两列和 100000 行组成的数据集,如下所示:

变量 Y 只能有两个值:0 或 1,而变量 TOTA 可以有不同的值。函数摘要给了我以下结果:

目标:

我想创建一个 10 行 3 列的表。每行代表我的数据集的十分位数,最后一行显示 NA。现在我想填充我的表格,查看数据集。如果数据集中的第一列是1 ,则将 +1 添加到创建的表中,其中值与其中一个列的值范围和“活跃公司数”列相匹配。如果第一个值为0,则在值与表值范围匹配的相应行的“被动公司数量”列中添加 +1。表格的每一行代表变量 TOTA 的不同范围

我已经尝试过

到目前为止,我尝试的是创建一个包含我的数据集处理结果的表

之后我创建了 10 个组,其中包含不同范围的变量:

现在我想以这种方式填充上一个表。我想分析 Y 变量的每一行,如果它是 1,它应该将 1 添加到活动公司的列号,并且当 Y 为零时,在该数字属于 anc 的行中相同。

问题

如何在表格中写字?如何以更简单的方式完成此过程?如何创建此表的直方图?

我想知道我是否做对了,因为我已经阅读了函数 quantile() 和 percentile() 的手册,而且它们似乎做同样的事情

你能否给我一些指导方针,可能还有一些命令来实现我的目标

谢谢