我第一次使用 Python Pandas。我有 csv 格式的 5 分钟滞后流量数据:
...
2015-01-04 08:29:05,271238
2015-01-04 08:34:05,329285
2015-01-04 08:39:05,-1
2015-01-04 08:44:05,260260
2015-01-04 08:49:05,263711
...
有几个问题:
- 对于某些时间戳,缺少数据 (-1)
- 缺少条目(也是连续 2/3 小时)
- 观察的频率不完全是 5 分钟,但实际上偶尔会损失几秒钟
我想获得一个定期的时间序列,所以每(正好)5分钟输入一次(并且没有缺失值)。我已使用以下代码成功插入时间序列,以使用此代码逼近 -1 值:
ts = pd.TimeSeries(values, index=timestamps)
ts.interpolate(method='cubic', downcast='infer')
如何对观察的频率进行插值和正则化?谢谢大家的帮助。