我有一个标记为不同城市债券的数据集:$y$=债券收益率,$x_1$=报价规模($\$$1000 债券)和 $x_2$=到期期限(100 个月)。我需要比较所有模型 $y=b_0+b_2x_2$、$y=c_0+c_1x_1+c_2x_2$ 和 $y=d_0+d_1x_1$ 的系数。
我能够制作第一个模型,但其他两个模型出现错误。这是前六个城市的值。
> head(bond)
N0 City X1 X2 Y
1 1 Birmingham 30 1.81 335
2 2 Oxnard 10 1.93 365
3 3 Salinas 30 2.79 315
4 4 Danbury 15 1.81 325
5 5 New Haven 15 1.87 283
6 6 Norwalk 40 2.17 300
线性 模型2c <- lm(y ~ X1 + X2, bond)
产生了
Error in model.frame.default(formula = y ~ X1 + X2, data = bond, drop.unused.levels = TRUE) :
variable lengths differ (found for 'X1')
最后一个模型是d <- lm(y ~ X1, bond)
导致
Error in model.frame.default(formula = y ~ X1, data = bond, drop.unused.levels = TRUE) :
variable lengths differ (found for 'X1')
问题:我不明白错误或如何继续纠正它。