我目前正在使用 Roger Koenker 的quantreg
包在 R 中运行分位数回归模型。我有一个有五个级别的有序分类变量和三个无序分类变量(星期几、季节以及是否是夜间),分别有七个、四个和两个类别。除了有序的分类变量(从 1 到 5 有五个级别)之外,所有最初都作为字符串存储在数据框中。这是我将前面提到的变量编码为因子的方式。请注意,之所以调用我的变量,是df_prime
因为它是带有一些修剪行的原始数据框:
df_prime$acuity_id <- ordered(df_prime$acuity_id, c(5, 4, 3, 2, 1))
df_prime$day_of_week <- as.factor(df_prime$day_of_week)
df_prime$season <- as.factor(df_prime$season)
df_prime$is_night <- as.factor(df_prime$is_night)
当我运行回归时,它完全从摘要和我的 acuity_id 的一个级别中删除了 Friday,这是我的有序变量。这可能与 R 如何创建虚拟变量有关吗?我注意到无论出于何种原因,seasonWinter 的 p 值为 1。
我的输出如下,尽管间距不同,因为我的工作场所在 VM 上有 R,我无法复制和粘贴:
Value Std. Error t value Pr(>|t|)
(Intercept) 173.20000 5.84510 29.63167 0.00000
day_of_weekMonday 19.33333 3.60107 5.36878 0.00000
day_of_weekSaturday -49.66667 3.41145 -14.55883 0.00000
day_of_weekSunday -42.00000 3.35297 -12.52620 0.00000
day_of_weekThursday 5.33333 3.51831 1.51588 0.12957
day_of_weekTuesday 3.00000 3.51917 0.85247 0.39396
day_of_weekWednesday 1.66667 3.75717 0.44360 0.65734
is_night1 -53.00000 2.04268 -25.94626 0.00000
seasonAutumn 8.00000 4.37771 1.82744 0.06765
seasonSpring -0.66667 4.46209 -0.14941 0.88123
seasonSummer 12.66667 4.40002 2.87877 0.00400
seasonWinter 0.00000 4.36418 0.00000 1.00000
acuity_id.L 37.94733 11.20886 3.38548 0.00071
acuity_id.Q -108.68624 9.48982 -11.45293 0.00000
acuity_id.C -36.36619 5.93905 -6.12324 0.00000
acuity_id^4 25.61773 2.77411 9.23459 0.00000