问题标签 [quantile]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2203 浏览

r - 如何从分位数回归 rq() 中提取系数的上限/下限

我想使用quantreg包从分位数回归中提取系数和上限和下限。这是帮助文件中的一个示例。

我知道我可以coefficients()用来获取系数。

但我不知道如何获得出现在summary(). 我看了看str(sf),但我没有看到如何提取。

最终,我想将 taus、系数和上限/下限放入数据框中以进行进一步处理。

0 投票
2 回答
798 浏览

r - 如何找到数字落在哪个分位数箱中

我知道如何找到经验分布的分位数。

有没有一个函数可以给我训练集所属的分位数箱?在这个例子中

它将是分位数 18(或 19,具体取决于您如何看待事物)

0 投票
1 回答
9900 浏览

python-2.7 - 熊猫分位数因 NaN 的存在而失败

我在计算四分位间距时遇到了一个有趣的情况。假设我们有一个数据框,例如:

第一个四分位数可以通过取数据框中低于整体中位数的值的中位数来计算,因此我们可以看到 data.quantile(0.25) 应该产生什么。例如

分位数似乎未能提供 q1 等的适当表示,因为它在处理 NaN 值方面做得不好(即它在没有 NaN 的情况下工作,但在 NaN 的情况下不工作)。

我认为这可能不是“NaN”问题,而可能是无法处理偶数数据集的分位数(即必须将中位数计算为两个中心数的平均值)。但是,在使用具有偶数行和奇数行的数据帧进行测试后,我发现分位数正确地处理了这些情况。只有当数据框中存在 NaN 值时,才会出现问题。

我想使用 quntile 来计算我的数据框中的滚动 q1/q3 值,但是,这不适用于 NaN 的存在。任何人都可以提供这个问题的解决方案吗?

0 投票
0 回答
191 浏览

latex - t分布分位数函数的软件实现

我想在我的一个文档中实现一个分位数函数LaTeX。具体来说,是 t 分布的分位数函数。是的,我说的是文档中的qt()函数的实际数值近似。R

分位数功能通常是如何实现的?无论是正则化 beta 函数,还是我在网络上任何地方都可以找到的超几何函数和LaTeX/tikZ似乎都没有计算积分或无限和/积(或者至少不是及时,我听说过大方向的选项包xint)。当我试图逼近分位数函数时,这两个函数(包括sgn(x),但在 中很容易实现)都会不断出现。TeX

如果您知道LaTeX分位数函数的特定实现,或者您知道从哪里开始,则可以加分。

0 投票
1 回答
2090 浏览

stata - 基于自变量的分位数回归

我正在尝试对每月观察(共同基金特征)进行分位数回归。我想做的是每月将我的观察结果分成五分之一(我的数据集包括 99 个月)。我想根据一个变量(滞后基金规模,即总净资产)来确定五分位数,该变量稍后将用作解释基金业绩的自变量。

我已经尝试做的是使用该qreg命令,但它使用基于因变量而不是所需自变量的分位数。

此外,我尝试使用该xtile命令来创建五分位数;但是,by:不支持该命令。

是否有一个(组合)命令可以使我免于逐月手动创建五分位数?

0 投票
1 回答
7753 浏览

r - 分位数函数错误

我想“截断”数据框中高于或低于分位数的值。

类似的东西,“TRUNC”是一个矩阵:

但是我一直收到这样的错误消息:

所以我尝试了一个简单的例子:

这也给了我同样的错误。

即使我尝试这样的事情:

它行不通!

如果有人可以向我解释解决方案,我将非常感激!

我的代码有什么问题?na.rm=T 不是应该解决数据集中的 NA 问题吗?

0 投票
1 回答
2976 浏览

r - qnorm 中的错误:缺少参数“p”,没有默认值

我正在尝试使用 R 来计算使用“完美”正态分布。换句话说,我不想从一些样本点中指定它——我没有——我只想给它提供平均值和标准偏差并计算分位数。

看来我应该使用qnorm,我会假设称它为qnorm(mean=1000, sd=50,但它抱怨argument "p" is missing, with no defaultp看起来是样本数据,但如果我知道平均值和标准差,那真的应该是无关紧要的。如果我完全省略参数,它实际上工作正常,但如果我输入这两个参数,它似乎期望p. 是什么赋予了?

这是一个最小的、完整的、可验证的示例:

这是我简明的问题陈述:

“使用qnorm函数时,我必须为变量提供p什么?”

这是所需的行为:

0 投票
1 回答
785 浏览

elasticsearch - elasticsearch中字符串字段的分位数聚合

我在弹性搜索索引中有一个字符串字段,并尝试在该字段上进行百分位数或分位数聚合(这对数字字段很有效)。

假设字符串字段中有 10,000 个名称或城市,预期结果应该是这样的:

当要求四个桶时:

这些术语不是按字母顺序均匀分布的,但桶的大小应该大致相同。2600,2400,2800,2200 的术语计数是可以接受的。

0 投票
0 回答
588 浏览

r - 使用 ggplot2 在多个 QQ 图中指定参数

我已经融化了一个数据集“mtotal”,并且想要针对正态分布制作一个 QQ 图,这样“mtotal”中的每个变量都有自己指定的参数(mean() 和 sd())。
到目前为止,我的代码如下所示:

它根据标准正态分布为每个变量制作一个 QQ 图。

mtotal 看起来像这样:

0 投票
0 回答
565 浏览

r - 当我运行分位数回归时,为什么 R 会从因子变量中删除因子?

我目前正在使用 Roger Koenker 的quantreg包在 R 中运行分位数回归模型。我有一个有五个级别的有序分类变量和三个无序分类变量(星期几、季节以及是否是夜间),分别有七个、四个和两个类别。除了有序的分类变量(从 1 到 5 有五个级别)之外,所有最初都作为字符串存储在数据框中。这是我将前面提到的变量编码为因子的方式。请注意,之所以调用我的变量,是df_prime因为它是带有一些修剪行的原始数据框:

当我运行回归时,它完全从摘要和我的 acuity_id 的一个级别中删除了 Friday,这是我的有序变量。这可能与 R 如何创建虚拟变量有关吗?我注意到无论出于何种原因,seasonWinter 的 p 值为 1。

我的输出如下,尽管间距不同,因为我的工作场所在 VM 上有 R,我无法复制和粘贴: