问题标签 [quantile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3700 浏览

matlab - 在 MATLAB 中计算分位数

MATLAB中是否有任何内置函数可以计算

参数 n=60 和 p=0.4 的二项式分布的第 0.025 个分位数

标准正态分布的 0.975 分位数 ?

0 投票
2 回答
2519 浏览

r - R根据行分位数选择每行的数据

我有一个包含 60 行和 3036 列的数据集。我已经用包中的函数计算了行分rowQuantiles位数matrixStats。从这里我得到了一个列向量[60,1]。现在,我只想从每一行中选择高于行分位数的数据。如果我使用 which 函数如下:

然后我松开数据维度,只得到一个数组而不是一个具有以下维度的矩阵 [60,152]。

有人可以帮助我吗?

谢谢!

0 投票
2 回答
3583 浏览

r - 如何通过分位数获取值的索引?

例如,如果我的数据如下所示:

我如何获得这样的列表:

所以我想把这25个元素分成5个子列表,找出每个元素所属的子列表的索引。数据未排序并且太大而无法排序。还有缺失值,在这种情况下,它们的索引将为 0。

抱歉,澄清一下,我不需要组的大小相等,但它们需要除以 0.2、0.4、0.6、0.8 分位数。

即我输出中的第 i 个元素应该是 a 中第 i 个元素所属的第 n 个分位数。例如,8 在第二个分位数中,我输出中的第 8 个元素是 2。

0 投票
3 回答
1357 浏览

r - 加快分位数计算

我正在使用Hmisc包计算两个连续变量的分位数并在交叉表中比较结果。您可以在下面找到我的代码。

我的问题是,如果观察次数增加,分位数的计算需要相当长的时间。

data.table有没有可能通过使用,ddply或任何其他包来加快这个过程?

谢谢。

0 投票
1 回答
1477 浏览

r - 首先手动计算分位数的置信区间(而不是在 R 中)

如果有人可以检查我的方法是否正确,那就太好了。简而言之,问题是,如果错误计算是正确的方法。假设我有以下数据。

此外,我想检查我的数据是否遵循正态分布。

编辑:我知道有测试等,但我将专注于构建带有置信度线的 qqplot。我知道汽车包里有一个方法,但我想了解这些线路的构建。

所以我计算了我的样本数据以及我的理论分布的百分位数(估计mu = 24.6609sigma = 1.6828。所以我最终得到了这两个包含百分位数的向量。

现在我想计算alpha=0.05理论百分位数的置信区间。如果我记得自己是正确的,则公式由下式给出

和。n=length(data)_z=quantil of the normal distribution for the given p

因此,为了获得第二个百分位数的置信区间,我将执行以下操作:

插入值:

最后我有

其余的也一样......

那你怎么看,我可以去吗?

0 投票
0 回答
887 浏览

mysql - MySQL 构建中位存储函数

我想构建一个存储函数来计算组内的分位数。我有一个非常好的来自网络的 SQL 来计算中位数: http: //geekyisawesome.blogspot.ch/2012/04/finding-median-value-using-mysql-sql.html。该 SQL 允许计算表中一个变量的中位数。我想通过分组计算中位数。为此,我必须先准备一张桌子,并在组内增加计数器。即使这对我来说也是一个挑战,所以我从 stackoverflow 获得了帮助:MySQL - Counter in group。综上所述,我能够计算组内的中位数:

我的想法是构建一个函数 QUANTILE 允许像这样计算分位数:

我从未构建存储函数/过程,并且在网络中查看存储函数中的表是硬编码的。所以,我想知道是否可以构建这样一个通用函数。感谢您的建议。

0 投票
2 回答
2451 浏览

r - 创建分位数

我有一个个人数据集,他们的社会经济分数从 -6.3 到 3.5 不等。现在我想根据每个人的社会经济分数将每个人分配到他们的分位数。

我有一个以Healthdata两列命名的数据集:Healthdata$SSEHealthdata$ID

最终,我想得到一个与他们的 SSE 分位数匹配的数据框。

我怎样才能在 R 中做到这一点?

0 投票
3 回答
1216 浏览

sas - 如何计算 SAS 频率表的分位数数据?

我有兴趣将我的数据分成三份,但我只有一个按州统计的汇总表。具体来说,我估计了各州的入学人数,我想计算哪些州占所有入学人数的前三分之一。因此,前三分之一应至少包含 0.33333 的总累积百分比......

我尝试了各种方法来指定 .33333 和 .40000 之间的累积百分比,但没有成功指定一般情况。 PROC RANK也不能使用,因为数据被组织为频率表......

我在下面包含了一些虚拟(但具有代表性)数据。



根据 的值cum_percent,占入学率前三分之一的州是:加利福尼亚州、德克萨斯州、纽约州、佛罗里达州和伊利诺伊州。

有没有办法以编程方式做到这一点?我最终想指定一个标志变量来选择状态。

谢谢...

0 投票
3 回答
697 浏览

r - 连续时间数据的分位数

我有 100 名受试者的血液浓度与时间的关系数据。我有兴趣绘制 5%、50% 和 95% 的分位数浓度与时间曲线。虽然我可以确定整个浓度范围的分位数,但我无法在 R 中弄清楚如何按时间对浓度分位数进行分层。任何帮助,将不胜感激。

不起作用。

0 投票
0 回答
188 浏览

matlab - matlab - 百分位数的时间序列分析

我目前在 csv 文件中有一个日期数据集、一个公司标识符和一个感兴趣的值。公司标识符和值都是数字。我的数据目前是平面文件格式,所以我目前有如下行

换句话说,我有平面文件格式的时间序列。我想通过为每个公司构建一个时间序列对象来浓缩这些数据。然后我想生成每个时间点的某些分位数的时间序列图,汇总所有公司。需要指出的其他事项是 companyid/date 对是唯一的,因此数据集中没有重复项,并且数据已经按 companyid 和日期排序。

这是我迄今为止尝试过的: