我有兴趣使用R中包环境中anova.rqlist
调用的函数比较来自不同分位数(相同结果,相同协变量)的估计值。但是函数中的数学超出了我的基本专业知识。假设我在不同的分位数上拟合了 3 个模型;anova
quantreg
library(quantreg)
data(Mammals) # data in quantreg to be used as a useful example
fit1 <- rq(weight ~ speed + hoppers + specials, tau = .25, data = Mammals)
fit2 <- rq(weight ~ speed + hoppers + specials, tau = .5, data = Mammals)
fit3 <- rq(weight ~ speed + hoppers + specials, tau = .75, data = Mammals)
然后我使用它们进行比较;
anova(fit1, fit2, fit3, test="Wald", joint=FALSE)
我的问题是这些模型中的哪一个被用作比较的基础?
我对 Wald 测试的理解(wiki 条目)
其中 θ^ 是与建议值 θ0 比较的感兴趣参数 θ 的估计值。
所以我的问题是选择θ0的anova
功能是什么?quantreg
基于从anova
我最好的猜测返回的 pvalue 是它正在选择指定的最低分位数(即tau=0.25
)。有没有办法指定中位数 ( tau = 0.5
) 或更好的平均估计值lm(y ~ x1 + x2 + x3, data)
?
anova(fit1, fit2, fit3, joint=FALSE)
实际产生
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.25 0.5 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
尽管
anova(fit3, fit1, fit2, joint=FALSE)
产生完全相同的结果
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.5 0.25 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
模型的顺序显然在方差分析中发生了变化,但是 F 值和 Pr(>F) 在两个测试中是如何相同的呢?