-1

我想简单地查看未来 4 个月招聘的预计人数。

我的数据有三个变量

HiringYear、hiringMonth 和 Number of Hires(不同订单的数量)

我的数据可以复制

structure(list(hireyear = c(2015L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2016L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2017L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2018L, 2019L, 2019L, 2019L), month = c(12L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 1L, 2L, 3L), number_of_distinct_orders = c(106L, 150L, 43L, 39L, 46L, 28L, 44L, 15L, 23L, 22L, 12L, 47L, 15L, 1998L, 75L, 165L, 158L, 75L, 49L, 46L, 51L, 25L, 33L, 37L, 36L, 67L, 167L, 41L, 49L, 41L, 263L, 49L, 62L, 48L, 51L, 46L, 37L, 67L, 40L, 12L)), row.names = 245:284, class = "data.frame")

4

2 回答 2

2

最简单的预测使用predict()

Model <- lm(data = df,number_of_distinct_orders~. )
predict(Model, newdata=df) 

       245        246        247        248        249        250        251        252        253        254        255 
 11.711985 272.554432 246.690574 220.826717 194.962859 169.099001 143.235144 117.371286  91.507428  65.643571  39.779713 
       256        257        258        259        260        261        262        263        264        265        266 
 13.915855 -11.948002 248.894444 223.030587 197.166729 171.302871 145.439014 119.575156  93.711298  67.847441  41.983583 
       267        268        269        270        271        272        273        274        275        276        277 
 16.119725  -9.744132 -35.607990 225.234457 199.370599 173.506742 147.642884 121.779026  95.915169  70.051311  44.187453 
       278        279        280        281        282        283        284 
 18.323596  -7.540262 -33.404120 -59.267978 201.574469 175.710612 149.846754 

仅前 4 个月:

predict(Model, newdata=df)[1:4]
  245       246       247       248 
11.71199 272.55443 246.69057 220.82672 
于 2019-03-04T08:25:03.243 回答
1

通常,从非常简单的开始并根据需要增加复杂性是值得的。做一些散点图和直方图可能有助于理解每个变量的分布以及它们如何相互关联。

下一步将是一个简单的线性回归,以衡量其他变量以最简单的方式描述人头数的程度。

这可能不会为您提供最佳拟合,在这种情况下,您可以扩展探索更多非线性回归。或者,我建议查看这篇文章,了解如何将时间序列分析纳入您的预测。 https://machinelearningmastery.com/time-series-forecasting/

于 2019-03-04T08:26:49.037 回答