“quantile”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

3700 浏览

matlab - 在 MATLAB 中计算分位数

MATLAB中是否有任何内置函数可以计算

参数 n=60 和 p=0.4 的二项式分布的第 0.025 个分位数

标准正态分布的 0.975 分位数 ?

matlab quantile

2013-11-12T14:57:41.173

0 投票

2 回答

2519 浏览

r - R根据行分位数选择每行的数据

我有一个包含 60 行和 3036 列的数据集。我已经用包中的函数计算了行分rowQuantiles位数matrixStats。从这里我得到了一个列向量[60,1]。现在，我只想从每一行中选择高于行分位数的数据。如果我使用 which 函数如下：

然后我松开数据维度，只得到一个数组而不是一个具有以下维度的矩阵 [60,152]。

有人可以帮助我吗？

谢谢！

r select row quantile

2013-11-18T16:02:10.610

0 投票

2 回答

3583 浏览

r - 如何通过分位数获取值的索引？

例如，如果我的数据如下所示：

我如何获得这样的列表：

所以我想把这25个元素分成5个子列表，找出每个元素所属的子列表的索引。数据未排序并且太大而无法排序。还有缺失值，在这种情况下，它们的索引将为 0。

抱歉，澄清一下，我不需要组的大小相等，但它们需要除以 0.2、0.4、0.6、0.8 分位数。

即我输出中的第 i 个元素应该是 a 中第 i 个元素所属的第 n 个分位数。例如，8 在第二个分位数中，我输出中的第 8 个元素是 2。

r list vector quantile

2013-11-21T04:14:59.183

0 投票

3 回答

1357 浏览

r - 加快分位数计算

我正在使用Hmisc包计算两个连续变量的分位数并在交叉表中比较结果。您可以在下面找到我的代码。

我的问题是，如果观察次数增加，分位数的计算需要相当长的时间。

data.table有没有可能通过使用,ddply或任何其他包来加快这个过程？

谢谢。

r data.table plyr crosstab quantile

2013-12-02T16:39:04.993

0 投票

1 回答

1477 浏览

r - 首先手动计算分位数的置信区间（而不是在 R 中）

如果有人可以检查我的方法是否正确，那就太好了。简而言之，问题是，如果错误计算是正确的方法。假设我有以下数据。

此外，我想检查我的数据是否遵循正态分布。

编辑：我知道有测试等，但我将专注于构建带有置信度线的 qqplot。我知道汽车包里有一个方法，但我想了解这些线路的构建。

所以我计算了我的样本数据以及我的理论分布的百分位数（估计mu = 24.6609和sigma = 1.6828。所以我最终得到了这两个包含百分位数的向量。

现在我想计算alpha=0.05理论百分位数的置信区间。如果我记得自己是正确的，则公式由下式给出

和。n=length(data)_z=quantil of the normal distribution for the given p

因此，为了获得第二个百分位数的置信区间，我将执行以下操作：

插入值：

最后我有

其余的也一样......

那你怎么看，我可以去吗？

r percentile confidence-interval quantile

2013-12-09T21:25:14.807

0 投票

0 回答

887 浏览

我想构建一个存储函数来计算组内的分位数。我有一个非常好的来自网络的 SQL 来计算中位数： http: //geekyisawesome.blogspot.ch/2012/04/finding-median-value-using-mysql-sql.html。该 SQL 允许计算表中一个变量的中位数。我想通过分组计算中位数。为此，我必须先准备一张桌子，并在组内增加计数器。即使这对我来说也是一个挑战，所以我从 stackoverflow 获得了帮助：MySQL - Counter in group。综上所述，我能够计算组内的中位数：

我的想法是构建一个函数 QUANTILE 允许像这样计算分位数：

我从未构建存储函数/过程，并且在网络中查看存储函数中的表是硬编码的。所以，我想知道是否可以构建这样一个通用函数。感谢您的建议。

mysql median stored-functions quantile

2013-12-16T09:47:25.753

0 投票

2 回答

2451 浏览

r - 创建分位数

我有一个个人数据集，他们的社会经济分数从 -6.3 到 3.5 不等。现在我想根据每个人的社会经济分数将每个人分配到他们的分位数。

我有一个以Healthdata两列命名的数据集：Healthdata$SSE和Healthdata$ID。

最终，我想得到一个与他们的 SSE 分位数匹配的数据框。

我怎样才能在 R 中做到这一点？

r matching quantile

2013-12-23T17:04:26.213

0 投票

3 回答

1216 浏览

sas - 如何计算 SAS 频率表的分位数数据？

我有兴趣将我的数据分成三份，但我只有一个按州统计的汇总表。具体来说，我估计了各州的入学人数，我想计算哪些州占所有入学人数的前三分之一。因此，前三分之一应至少包含 0.33333 的总累积百分比......

我尝试了各种方法来指定 .33333 和 .40000 之间的累积百分比，但没有成功指定一般情况。 PROC RANK也不能使用，因为数据被组织为频率表......

我在下面包含了一些虚拟（但具有代表性）数据。

根据的值cum_percent，占入学率前三分之一的州是：加利福尼亚州、德克萨斯州、纽约州、佛罗里达州和伊利诺伊州。

有没有办法以编程方式做到这一点？我最终想指定一个标志变量来选择状态。

谢谢...

sas frequency quantile

2013-12-30T19:25:07.797

0 投票

3 回答

697 浏览

r - 连续时间数据的分位数

我有 100 名受试者的血液浓度与时间的关系数据。我有兴趣绘制 5%、50% 和 95% 的分位数浓度与时间曲线。虽然我可以确定整个浓度范围的分位数，但我无法在 R 中弄清楚如何按时间对浓度分位数进行分层。任何帮助，将不胜感激。

不起作用。

r plot continuous quantile

2013-12-30T19:58:29.677

0 投票

0 回答

188 浏览

matlab - matlab - 百分位数的时间序列分析

我目前在 csv 文件中有一个日期数据集、一个公司标识符和一个感兴趣的值。公司标识符和值都是数字。我的数据目前是平面文件格式，所以我目前有如下行

换句话说，我有平面文件格式的时间序列。我想通过为每个公司构建一个时间序列对象来浓缩这些数据。然后我想生成每个时间点的某些分位数的时间序列图，汇总所有公司。需要指出的其他事项是 companyid/date 对是唯一的，因此数据集中没有重复项，并且数据已经按 companyid 和日期排序。

这是我迄今为止尝试过的：

matlab time-series quantile timeserieschart

2014-02-02T14:03:14.093

问题标签 [quantile]

matlab - 在 MATLAB 中计算分位数

r - R根据行分位数选择每行的数据

r - 如何通过分位数获取值的索引？

r - 加快分位数计算

r - 首先手动计算分位数的置信区间（而不是在 R 中）

mysql - MySQL 构建中位存储函数

r - 创建分位数

sas - 如何计算 SAS 频率表的分位数数据？

r - 连续时间数据的分位数

matlab - matlab - 百分位数的时间序列分析

问题标签 [quantile]

Reference