所以我的数据看起来像:
year, y, x1, x2, x3, x4
2009, 0.5, 0.4, 0.4, 0.9
2013, nan, 0.4, 0.5, 0.8
2020, 0.8, 0.39, 0.51, 0.7
数据是按年计算的,但每年之间的间隔并不一致。y 的值取决于时间和特征。但在某些情况下,我最需要的 y 丢失了。其他功能也可能会丢失,但大多数情况下它们都在那里。我曾尝试通过df.interpolate()
函数输入数据,但值在大多数函数的区间中并不合适。我尝试过 ARIMA、LSTM 等,但他们不考虑输入特征。我也考虑过使用回归技术,但它们不包含数据的时间序列性质。
那么对于这种情况,最好的方法是什么。IE
如何根据输入特征估算时间序列值?