问题标签 [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 在 MATLAB 中计算分位数
MATLAB中是否有任何内置函数可以计算
参数 n=60 和 p=0.4 的二项式分布的第 0.025 个分位数
标准正态分布的 0.975 分位数 ?
r - R根据行分位数选择每行的数据
我有一个包含 60 行和 3036 列的数据集。我已经用包中的函数计算了行分rowQuantiles
位数matrixStats
。从这里我得到了一个列向量[60,1]。现在,我只想从每一行中选择高于行分位数的数据。如果我使用 which 函数如下:
然后我松开数据维度,只得到一个数组而不是一个具有以下维度的矩阵 [60,152]。
有人可以帮助我吗?
谢谢!
r - 如何通过分位数获取值的索引?
例如,如果我的数据如下所示:
我如何获得这样的列表:
所以我想把这25个元素分成5个子列表,找出每个元素所属的子列表的索引。数据未排序并且太大而无法排序。还有缺失值,在这种情况下,它们的索引将为 0。
抱歉,澄清一下,我不需要组的大小相等,但它们需要除以 0.2、0.4、0.6、0.8 分位数。
即我输出中的第 i 个元素应该是 a 中第 i 个元素所属的第 n 个分位数。例如,8 在第二个分位数中,我输出中的第 8 个元素是 2。
r - 加快分位数计算
我正在使用Hmisc
包计算两个连续变量的分位数并在交叉表中比较结果。您可以在下面找到我的代码。
我的问题是,如果观察次数增加,分位数的计算需要相当长的时间。
data.table
有没有可能通过使用,ddply
或任何其他包来加快这个过程?
谢谢。
r - 首先手动计算分位数的置信区间(而不是在 R 中)
如果有人可以检查我的方法是否正确,那就太好了。简而言之,问题是,如果错误计算是正确的方法。假设我有以下数据。
此外,我想检查我的数据是否遵循正态分布。
编辑:我知道有测试等,但我将专注于构建带有置信度线的 qqplot。我知道汽车包里有一个方法,但我想了解这些线路的构建。
所以我计算了我的样本数据以及我的理论分布的百分位数(估计mu = 24.6609
和sigma = 1.6828
。所以我最终得到了这两个包含百分位数的向量。
现在我想计算alpha=0.05
理论百分位数的置信区间。如果我记得自己是正确的,则公式由下式给出
和。n=length(data)
_z=quantil of the normal distribution for the given p
因此,为了获得第二个百分位数的置信区间,我将执行以下操作:
插入值:
最后我有
其余的也一样......
那你怎么看,我可以去吗?
mysql - MySQL 构建中位存储函数
我想构建一个存储函数来计算组内的分位数。我有一个非常好的来自网络的 SQL 来计算中位数: http: //geekyisawesome.blogspot.ch/2012/04/finding-median-value-using-mysql-sql.html。该 SQL 允许计算表中一个变量的中位数。我想通过分组计算中位数。为此,我必须先准备一张桌子,并在组内增加计数器。即使这对我来说也是一个挑战,所以我从 stackoverflow 获得了帮助:MySQL - Counter in group。综上所述,我能够计算组内的中位数:
我的想法是构建一个函数 QUANTILE 允许像这样计算分位数:
我从未构建存储函数/过程,并且在网络中查看存储函数中的表是硬编码的。所以,我想知道是否可以构建这样一个通用函数。感谢您的建议。
r - 创建分位数
我有一个个人数据集,他们的社会经济分数从 -6.3 到 3.5 不等。现在我想根据每个人的社会经济分数将每个人分配到他们的分位数。
我有一个以Healthdata
两列命名的数据集:Healthdata$SSE
和Healthdata$ID
。
最终,我想得到一个与他们的 SSE 分位数匹配的数据框。
我怎样才能在 R 中做到这一点?
sas - 如何计算 SAS 频率表的分位数数据?
我有兴趣将我的数据分成三份,但我只有一个按州统计的汇总表。具体来说,我估计了各州的入学人数,我想计算哪些州占所有入学人数的前三分之一。因此,前三分之一应至少包含 0.33333 的总累积百分比......
我尝试了各种方法来指定 .33333 和 .40000 之间的累积百分比,但没有成功指定一般情况。 PROC RANK
也不能使用,因为数据被组织为频率表......
我在下面包含了一些虚拟(但具有代表性)数据。
根据 的值cum_percent
,占入学率前三分之一的州是:加利福尼亚州、德克萨斯州、纽约州、佛罗里达州和伊利诺伊州。
有没有办法以编程方式做到这一点?我最终想指定一个标志变量来选择状态。
谢谢...
r - 连续时间数据的分位数
我有 100 名受试者的血液浓度与时间的关系数据。我有兴趣绘制 5%、50% 和 95% 的分位数浓度与时间曲线。虽然我可以确定整个浓度范围的分位数,但我无法在 R 中弄清楚如何按时间对浓度分位数进行分层。任何帮助,将不胜感激。
不起作用。
matlab - matlab - 百分位数的时间序列分析
我目前在 csv 文件中有一个日期数据集、一个公司标识符和一个感兴趣的值。公司标识符和值都是数字。我的数据目前是平面文件格式,所以我目前有如下行
换句话说,我有平面文件格式的时间序列。我想通过为每个公司构建一个时间序列对象来浓缩这些数据。然后我想生成每个时间点的某些分位数的时间序列图,汇总所有公司。需要指出的其他事项是 companyid/date 对是唯一的,因此数据集中没有重复项,并且数据已经按 companyid 和日期排序。
这是我迄今为止尝试过的: