问题标签 [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Quantile regression and p-values
I am applying guantile regression for my data-set (using R). It is easy to produce the nice scatterplot-image with different quantile regression lines (taus <- c(0.05,0.25,0.75,0.95)).
Problem occurs when I want to produce p-values (in order to see statistical significance of each regression line) for each one of these quantiles. For median quantile (tau=0.5) this is not problematic, but when it comes to for example tau=0.25, I get following error message:
What could be the reason for this?
Also: Is it recommendable to mention p-values and coefficients regarding the results of quantile regression model or could it be enough to show just the plot-picture and discuss the results based on that picture?
Best regards, frustrated person
r - 在 R 中执行逐列操作
乡亲
我有建筑物中每个区域的温度数据,如下所示:
我想做的是计算每个区域温度的 99%。我将执行此命令:
但随后我将不得不为数据集中的每一列手动执行此操作。有没有办法让这个命令遍历所有列(从第二列开始)?
非常感谢。
r - 为什么 1.59 不等于 1.59
好的,所以我在这里遇到了最奇怪的问题。当我们通过自变量 X 的特定分位数划分空间时,我正在取因变量 Y 的平均值。
我的问题是,R 中的分位数函数没有返回我的自变量 X 范围内的值,但是当打印到屏幕上时它返回的值是正确的值。让这个奇怪的是它只发生在特定的分位数上。
一些示例代码来演示这种奇怪的效果:
你们可以提供的任何见解将不胜感激。
regression - R:在函数中调用 rq() 并定义线性预测器
我试图在函数中调用 quantreg 包的 rq() 。以下是对我的问题的简化解释。
如果我遵循 http://developer.r-project.org/model-fitting-functions.txt中的建议,我在行后有一个设计矩阵
第一列全为 1 以创建截距。
现在,当我调用 rq() 时,我不得不使用类似
如果有超过 1 个解释变量,我的问题就会发生。我不知道如何找到一种自动编写方式:
这是完整的简化代码:
我用以下方法调用该函数:
以下是获取数据的方法:
在这种情况下,使用此代码,我的线性预测器仅包含“治疗”。如果我想要“额外”,我必须在代码中的 rq() 的线性预测器中手动添加 x[,3] 。这不是自动的,并且不适用于具有未知数量变量的其他数据集。有谁知道如何解决这个问题?
任何帮助将不胜感激 !!!
python - 获取 SciPy 分位数以匹配 Stata xtile 函数
我继承了一些旧的 Stata 代码 (Stata11),它使用该xtile
函数按分位数对向量中的观察值进行分类(在这种情况下,只是标准的 5 个五分位数,20%、40%、60%、80%、100%) .
我正在尝试在 Python 中复制一段代码,并且我正在使用 SciPy.stats.mstats 函数mquantiles()
进行计算。
据我从 Stata 文档和在线搜索中可以看出,Stataxtile
方法试图反转数据的经验 CDF,并使用 CDF 平坦的所有观察值的等加权平均值来制作切点。这似乎是对分位数进行分类的一种非常糟糕的方法,但事实就是如此,我相信在某些情况下这是正确的做法。
我的问题是如何mquantiles()
产生同样的打破惯例。我注意到这个函数有两个参数,alphap
并且betap
(文档调用它们alpha
,beta
但是你需要额外的'p'才能让它工作,至少我这样做......如果我只使用'alpha'和' beta' 与 Python 2.7.1 和 SciPy 0.10.0)。但即使在 SciPy 文档中,我也看不出这些参数的组合是否会在平坦的 CDF 范围内产生平均值。
我看到了看起来像计算为这个范围的中位数或众数的选项,但不是平均值(也不清楚这些具有 alpha 和 beta 的 SciPy 中位数/众数选项是否被计算为观测值的中位数/众数或产生平坦 CDF 值的范围。)
任何有助于消除这些不同选项的歧义并找到一些帮助我在 Python 中重新创建 Stata 约定的文档都会很棒。请不要回答只是说“编写自己的分位数函数”。首先,这无助于我理解 Stata 或 SciPy 的约定,其次,鉴于这些数值库,编写我自己的分位数函数应该是最后的手段。我当然可以做到,但如果我需要,那就不好了。
r - 处理 quantcut() 中的关系
我正在尝试使用 R 函数 quantcut() 将数值变量重新编码为具有对应于分位数的水平的因子。例如:
我收到错误消息:“cut.default 中的错误(x[!flag],breaks = newquant,include.lowest = TRUE,:'breaks' 不是唯一的”。我认为这是因为分位数中有联系,但是quantcut 的文档专门显示了一个示例,说明该函数如何通过使用更少的间隔来处理关系。无论我是否指定标签参数,都会发生错误。
任何建议将不胜感激。
编辑:这是输入变量 X 的代码:
r - 在 R / GGPLOT2 中绘制百分比指示
我有一个两列数据框的基本图(x =“期间”和 y =“范围”)。
我试图在每个时期添加一条水平线,低于该时期所有观察值的 90%。(它不必是一条水平线,每个周期的任何视觉指示就足够了)。
任何帮助将不胜感激。
python - 列出 Python 分位数
我正在做一个分位数问题,我需要做这样的事情
间隔:
这些是变量,我需要它,因为我正在做一个表格的间隔
c++ - 寻找四分位数
我编写了一个程序,用户可以在其中输入任意数量的值到向量中,它应该返回四分位数,但我不断收到“向量下标超出范围”错误:
r - 分位数回归和 p 值 - 获得更多小数位
使用 R 和 package quantreg
,我正在对我的数据执行分位数回归分析。
我可以使用汇总函数中的 se(标准误差)估计器访问 p 值,如下所示,但是我只得到 5 个小数位,并且想要更多。
我如何才能访问 p 值的更多小数位?
更新
好的,所以我可以通过选择包含数值结果矩阵的子对象来获得更多小数位;
然而,当 P 值 <1e-12 时,P 值仍舍入为 0(上述输出是简化的示例模型)。我可以通过应用@seancarmody 的建议获得更多信息;
但是如果 P < 1e-22 它仍然四舍五入为 0,并且如果“digits”设置为 > 22,我会收到以下错误;
prettyNum(.Internal(format(x, trim, digits, nsmall, width, 3L, : invalid 'digits' argument) 中的错误
是否可以访问更多小数位?