1

我有一个训练数据train,其中distancedest_zip_code作为预测变量来预测delivery_days。我正在使用rangerRF 模型创建“分位数 RF 回归”模型对象。请注意,dest_zip_codetraining_data 中的级别基于 6 个月。

现在,我有两个相同的测试集test_Atest_B

  • test_Adest_zip_code过去 2 个月开始,水平也基于过去 2 个月。
  • test_Bdest_zip_code过去 2 个月开始,但级别被重构为持续 6 个月(与火车数据相同的级别)

当我predict在具有相同训练模型对象的两个测试集上使用该函数时,至少有一半的预测是不同的。

  1. 有人可以帮助我了解具有相同观察结果的测试数据的不同分解级别如何影响预测吗?
  2. 哪一个在理论上是正确的?
4

0 回答 0