我的数据:每 3 分钟一次的股票行情数据。日期/开盘/高/低/收盘
目标:每天重新采样
我能够弄清楚如何重新采样到日常使用
df_spy_D= df_spy_3min.resample('D').agg({'open':'first',
'high':'max',
'low':'min',
'close':'last'})
这通过给我这个起作用:
date
2018-12-21 00:00:00+00:00 241.10 241.10 240.18 240.30
2018-12-22 00:00:00+00:00 240.30 240.70 240.26 240.35
2018-12-23 00:00:00+00:00 NaN NaN NaN NaN
2018-12-24 00:00:00+00:00 241.70 242.45 232.61 233.08
2018-12-25 00:00:00+00:00 NaN NaN NaN NaN
2018-12-26 00:00:00+00:00 234.05 246.90 231.99 245.50
2018-12-27 00:00:00+00:00 245.50 248.97 238.96 247.57
2018-12-28 00:00:00+00:00 247.55 251.40 246.45 247.55
2018-12-29 00:00:00+00:00 247.52 247.66 247.52 247.57
2018-12-30 00:00:00+00:00 NaN NaN NaN NaN
2018-12-31 00:00:00+00:00 249.62 250.48 247.47 250.00
2019-01-01 00:00:00+00:00 250.00 250.10 250.00 250.09
2019-01-02 00:00:00+00:00 248.00 251.21 244.70 246.65
2019-01-03 00:00:00+00:00 246.65 248.57 243.67 244.21
2019-01-04 00:00:00+00:00 244.21 253.11 243.19 252.56
问题:
- 市场未交易的天数为 NaN。我绝对可以删除这些
- 有些日子只有部分日期,我认为这可能与这些数据是从他们估计隔夜价格的交易所中提取的事实有关。
我拥有的数据适用于所有交易时间,包括各种市场时间,例如美国上市前常规时间、售后市场等
那么我是否需要定义一天的开盘和关盘时间才能仅为美国时段重新采样?如果是这样,怎么做?
对于没有足够数据的日子,假设 count 是