问题标签 [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 未知累积函数的反函数
我正在处理一个数据文件,里面的观察结果是随机值。在这种情况下,我不知道 x 的分布(我的观察)。我使用函数密度来估计密度,因为我必须应用核估计。
在此之后我必须整合它,因为我正在寻找一个分位数(类似于 VaR,95%)。为此,我有 2 个选项:
现在我有了分位数 95 的值,但这是内核估计的数据。
是否有一个函数可以用来知道原始数据的分位数 95 的值?
我说这是一个未知的分布,为此我想将非参数方法想象成牛顿,就像 SAS 中的方法一样solve()
r - 在 R 中找到截断伽马分布的 95 个可信区间
我有一个支持 [4,6] 的 Gamma(shape=50, scale=0.1)。我能够通过将完整的伽马分布除以 F(6) - F(4) 来找到它的分布。
我如何找到这个截断分布的中心 95 可信区间(即 d2)?
编辑:请注意,我的截断伽玛与标准伽玛没有相同的 pdf。原因是截断的 gamma 必须重新归一化,以便它在支持上积分为 1 [4,6]。这就是为什么 d2 = d2.full / (F(6) - F(4))
r - 在分位数回归中测试斜率
我正在使用quantreg
R 中的包对一组数据运行分位数回归 (95%)。
我想将分位数回归的斜率设置为值 1.4,就像我在之前的分析中所做的那样,我想用它来比较我的结果。如果lm()
使用函数可以做到这一点offset()
,则使用rq()
固定分位数(例如 0.025)这是行不通的。
代码没有给出错误,但 1.4 的值对我的结果没有影响。
r - 散点图的非参数分位数回归曲线
IV=time
我用,创建了一个散点图(多组 GRP)DV=concentration
。我想将分位数回归曲线添加(0.025,0.05,0.5,0.95,0.975)
到我的图中。
顺便说一句,这就是我创建散点图的方法:
因为我在这里创建的数据是我的较大数据的一小部分,所以它看起来可以近似为一个矩形双曲线。但我还不想称我的自变量和因变量之间存在数学关系。
我认为nlrq
从包quantreg
中可能是答案,但是当我不知道我的变量之间的关系时,我不明白如何使用该函数。
我从一篇科学文章中找到了这张图,我想做完全相同的图:
再次感谢您的帮助!
更新
Test.csv 有人指出我的样本数据不可重现。这是我的数据示例。
我也试过 qcbvnonpar::evd,但曲线似乎不是很平滑。
r - R中“分位数”函数的行为
在解决问题时,我发现了一些有趣的事情。我不知道到底发生了什么,但发生了一些我没想到会发生的事情。我可能犯了一个错误,但让我从一个例子开始:
我们得到三个不同的结果,但是如何解释这些结果。这些是使用的限制吗?
更新:我想我问错了问题。我们如何解释以下内容:
r - 我的生存对象有什么问题?
我有一个生存对象R
。
print(surv)
给我
但是,quantile(surv)
不起作用并输出
对我来说这有点奇怪,因为R
能够计算中位数(177)但不能计算其他四分位数。
我的生存对象有什么问题?
[编辑]
也许这是问题的最小示例:在文档中(http://stat.ethz.ch/R-manual/R-patched/library/survival/html/quantile.survfit.html)有这个例子:
现在,如果我只想重复这个输出的第一行,我会做
quantile(fit$time)
@Edwin建议在下面使用
然而,这显然会导致不同的结果。
[已关闭]
请忽略下面的答案,因为它们没有quantile.survfit
在survival
包中使用,而是使用R
s 内置quantile
函数。
更新到最新版本的survival
-package 以解决此问题。
这样做
请注意,您可能需要 root 权限才能执行此操作。
r - 比较 R 中面板数据的分位数回归程序(即 lqmm() 和 rqpd())
对于具有固定效应的给定面板数据分位数回归问题(参见下面的示例),是否可以使lqmm()
输出完全(或至少密切)匹配来自的输出rqpd()
?
请参阅下面的示例和随后的结论/评论。我的结论正确吗?
结论/评论
- 我们期望对于 lambda 的特定选择,
rqpd()
应该紧密匹配lqmm()
。我想应该是什么时候lambda=1/(2 cov.lqmm)
。正确的?- 我说的是紧密匹配而不是精确匹配,因为
rqpd
它基于固定 lambda 的 L1 正则化,而我认为 (??)lqmm
是基于 L2 正则化但针对由 Geraci 和 Bottai (2007) 中的程序产生的特定 lambda。
- 我说的是紧密匹配而不是精确匹配,因为
- 一开始,至少当nK 小时,即nK=7 时,这不会发生。但是随着 nK 增加到 100 或 1000,这两个过程“似乎”接近
- 因此,似乎适当使用
lqmm
至少取决于对 nK 的良好(也许足够大)选择。 - 我正在探索使用 ,
lqmm()
因为这里系统地选择了惩罚参数,而rqpd()
需要提供它。但是,由于我无法匹配特定lqmm()
的rqpd
lambda 选择,我不确定我是否理解lqmm
正在做什么。
r - qqline没有给出我预期的线路
如果我针对卡方分布绘制我的多元数据的马氏距离的多元 qqplot,我希望随附的 qqline 是一条截距为 0 且斜率为 1 的线。但如果我运行以下代码:
我得到下图:
我预计 qqline(红色)与截距 0 和斜率 1(黑色)的线相同。谁能向我解释为什么这两条线不匹配?
(我正在运行 R 版本 2.15.3 (2013-03-01))
calculated-columns - 创建新列 B 指示每行 Col A 所在的五分之一
我希望计算我的数据框中的每条记录所在的五分之一,因为它与各个列有关。例如,使用 mtcars 数据集,我需要一个类似于 MPG_QUINTILE 的列。我刚刚输入了该列并猜测了 mpg 将在哪个五分之一。但是我该如何自动化呢?我需要为几列做这件事。即HP_QUINTILE等。
无论如何,我希望找到一个不需要自定义构建功能的解决方案。此外,如果您想要大小相同的五分位数(每个 bin 的记录数相同)与严格基于百分位数的五分位数怎么办?