0

我目前正在使用 Roger Koenker 的quantreg包在 R 中运行分位数回归模型。我有一个有五个级别的有序分类变量和三个无序分类变量(星期几、季节以及是否是夜间),分别有七个、四个和两个类别。除了有序的分类变量(从 1 到 5 有五个级别)之外,所有最初都作为字符串存储在数据框中。这是我将前面提到的变量编码为因子的方式。请注意,之所以调用我的变量,是df_prime因为它是带有一些修剪行的原始数据框:

df_prime$acuity_id <- ordered(df_prime$acuity_id, c(5, 4, 3, 2, 1))
df_prime$day_of_week <- as.factor(df_prime$day_of_week)
df_prime$season <- as.factor(df_prime$season)
df_prime$is_night <- as.factor(df_prime$is_night)

当我运行回归时,它完全从摘要和我的 acuity_id 的一个级别中删除了 Friday,这是我的有序变量。这可能与 R 如何创建虚拟变量有关吗?我注意到无论出于何种原因,seasonWinter 的 p 值为 1。

我的输出如下,尽管间距不同,因为我的工作场所在 VM 上有 R,我无法复制和粘贴:

                 Value           Std. Error     t value          Pr(>|t|)
(Intercept)          173.20000       5.84510        29.63167         0.00000
day_of_weekMonday     19.33333       3.60107         5.36878         0.00000
day_of_weekSaturday  -49.66667       3.41145       -14.55883         0.00000
day_of_weekSunday    -42.00000       3.35297       -12.52620         0.00000
day_of_weekThursday    5.33333       3.51831         1.51588         0.12957
day_of_weekTuesday     3.00000       3.51917         0.85247         0.39396
day_of_weekWednesday   1.66667       3.75717         0.44360         0.65734
is_night1            -53.00000       2.04268       -25.94626         0.00000
seasonAutumn           8.00000       4.37771         1.82744         0.06765
seasonSpring          -0.66667       4.46209        -0.14941         0.88123
seasonSummer          12.66667       4.40002         2.87877         0.00400
seasonWinter           0.00000       4.36418         0.00000         1.00000
acuity_id.L           37.94733      11.20886         3.38548         0.00071
acuity_id.Q         -108.68624       9.48982       -11.45293         0.00000
acuity_id.C          -36.36619       5.93905        -6.12324         0.00000
acuity_id^4           25.61773       2.77411         9.23459         0.00000
4

0 回答 0