问题标签 [quantreg]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R 中 quantreg 包中的 anova.rq()
我有兴趣使用R中包环境中anova.rqlist
调用的函数比较来自不同分位数(相同结果,相同协变量)的估计值。但是函数中的数学超出了我的基本专业知识。假设我在不同的分位数上拟合了 3 个模型;anova
quantreg
然后我使用它们进行比较;
我的问题是这些模型中的哪一个被用作比较的基础?
我对 Wald 测试的理解(wiki 条目)
其中 θ^ 是与建议值 θ0 比较的感兴趣参数 θ 的估计值。
所以我的问题是选择θ0的anova
功能是什么?quantreg
基于从anova
我最好的猜测返回的 pvalue 是它正在选择指定的最低分位数(即tau=0.25
)。有没有办法指定中位数 ( tau = 0.5
) 或更好的平均估计值lm(y ~ x1 + x2 + x3, data)
?
实际产生
尽管
产生完全相同的结果
模型的顺序显然在方差分析中发生了变化,但是 F 值和 Pr(>F) 在两个测试中是如何相同的呢?
r - R 和 quantreg:不平衡残差
我正在尝试使用该quantreg
软件包来拟合指数曲线。
这是一个可复制的示例。IRL 我有更复杂的异常值数据,这就是为什么我不喜欢使用nls
对异常值不可靠的数据。
我预计会有sum(qr_exp$m$resid())
大约 0, tau = 0.5
但该值为负数,这意味着模型倾向于高估实际值。
如您所见,我的残差总和更接近于 0tau= 0.47
我真的不明白为什么。
是因为可能有无限数量的解决方案,因此不能保证负残差比正残差多吗?
如果是的话,如果这对我来说非常重要,那么最好的解决方案是什么:
- 最小化最小绝对偏差而不是最小二乘偏差(对异常值不稳健)
- 有平衡残差吗?
添加一小部分 L2 惩罚来平衡是否有意义?(参见Huber 损失)
r - 分位数斜率对 OLS 斜率的假设检验
使用标准函数在分位数 0.1 和 0.9 之间使用等斜率的优秀quantreg
封装和测试假设。anova
model <- food ~ income
anova(rq(model,tau=0.1), rq(model,tau=0.9))
零 p-val 导致我们拒绝 q1 和 q9 的斜率相等的原假设
运行相同的 anova 以将分位数回归与 OLS 进行比较时,出现错误
anova(rq(model,tau=0.5), lm(model))
有什么建议么?
r - ggplot stat_quantile 中的分位数是什么?
这是我的可重现数据:
我正在尝试熟悉stat_quantile但文档中的示例提出了几个问题。
据我了解,分位数将数据拆分为小于定义的截止值的部分,对吗?如果我在下面的代码中定义分位数,我会得到五行。为什么?它们代表什么?
似乎分位数是根据 y 轴上的因变量(评级)计算的。有可能扭转这种局面吗?我的意思是根据“年”中的分位数分割数据?
python - 使用 rpy2 的 pandas DataFrame 的分位数回归模型中的不合格数组
我正在使用 rpy2 (2.7.6) 对 engel 数据集进行分位数回归:
但是,这会产生以下错误:
据我了解,在这种情况下,不一致的数组意味着存在一些缺失值或使用的“数组”大小不同。我可以确认情况并非如此:
这个错误还有什么意思?rpy2中从DataFrame到data.frame的转换是否可能无法正常工作,或者我在这里遗漏了什么?其他人可以确认此错误吗?
以防万一这里有一些关于 R 和 Python 版本的信息。
任何帮助,将不胜感激。
编辑1:
如果我直接从 RI 加载数据集,则不会出现错误:
所以我认为使用pandas2ri
. 当我尝试使用手动将 DataFrame 转换为 data.frame 时,也会发生同样的错误pandas2ri.py2ri
。
编辑2:
有趣的是,如果我使用不推荐使用pandas.rpy.common.convert_to_r_dataframe
的错误就消失了:
肯定有一个错误,在这里pandas2ri
也得到了确认。
r - 拟合分位数回归。不同的行数测试/训练
我需要对我的数据进行分位数回归。我使用这样的代码:
但是,我收到错误消息:
警告消息:
“newdata”有 60000 行,但找到的变量有 30000 行
我的训练集中有 30k 行,测试集中有 60k 行。脚本有效,但是,它只创建 30k 值,而不是预期的 60k。我如何Y
在这里使用分位数回归拟合和预测测试集中的值?
r - 使用stat_quantile时ggplot2中的置信区间带?
我想将中值样条曲线和相应的置信区间带添加到ggplot2
散点图中。我正在使用'quantreg'-package,更具体地说是rqss
函数(Additive Quantile Regression Smoothing)。
在ggplot2
我可以添加中值样条,但不能添加置信区间带:
-packagequantreg
自带绘图功能;plot.rqss
. 我可以在哪里添加置信带(bands=TRUE
):
但是 -package 附带的绘图功能quantreg
不是很灵活/很适合我的需要。是否有可能在ggplot2
情节中获得置信带?也许通过模仿 -package 中使用的方法quantreg
,或者只是从情节中复制它们?
数据:pastebin。
r - 检验分位数回归模型中的系数是否存在显着差异
我有一个分位数回归模型,我对估计 .25、.5 和 .875 分位数的影响感兴趣。我的模型中的系数彼此不同,这与我的模型所依据的实质性实体理论一致。
下一步是测试一个分位数的特定解释变量的系数是否与另一个分位数的估计系数显着不同。我该如何测试?此外,我还想测试给定分位数的该变量的系数是否与 OLS 模型中的估计值显着不同。我怎么做?
我对任何答案都感兴趣,尽管我更喜欢涉及 R 的答案。这是一些测试代码:(注意:这不是我的实际模型或数据,而是一个简单的示例,因为数据在 R 安装中可用)
和 OLS 模型:
(不要担心上面估计的实际模型,这仅用于说明目的)例如,现在如何测试分位数 0.25 和 0.75 之间的 Temp 系数是否在统计上显着不同(在某个给定水平),以及是否Temp 的 0.25 分位数系数与 Temp 的 OLS 系数显着不同?
欢迎使用 R 或那些专注于统计方法的答案。
r - 分位数回归误差包 AER
我使用包 AER 中的数据 HousePrices 来运行分位数回归。首先,我为分类变量创建了假人。然后我运行了基本的 ols 回归。这是我的回归:
然后
summary(myreg1)
绘制。但是当我尝试进行分位数回归时,我没有收到错误,但在使用summary(myqreg1)
命令时收到了警告消息。
summary(myqreg1)
然后我将 tau 包括在内我的回归:
再次收到警告消息,但现在有 4 个警告:
我在互联网上搜索了很多,但找不到答案。