我要做的基本上是合并DataFrame
Pandas 中的两个对象,同时保留索引(DateTimeIndex
)。merge
或都不ordered_merge
支持这一点。假设我有这样构造的股票数据:
from pandas.io.data import DataReader
from datetime import datetime
aapl_old = DataReader('AAPL', 'yahoo', datetime(2013,1,1), datetime(2013,3,1))
aapl_new = DataReader('AAPL', 'yahoo', datetime(2013,2,1), datetime(2013,4,1))
我将如何着手将最终DataFrame
与索引合并?
到目前为止我尝试过的(并且不起作用):
任何类型的
merge
操作 - 据我所知,根本不支持在多对多数据上保留索引索引切片的一些变化:
aapl_new.ix[aapl_new.ix > aapl_old.ix[-1]] aapl_new.ix[aapl_new.ix > aapl_old.ix[-1].name]
我认为我可以如何解决这个问题:
- 不同版本的索引切片 - 我是否以错误的方式接近这个?
- A
reset_index()
和reindex()
操作 - 零件有很多麻烦reindex()
。 - 查找唯一的索引和
aapl_new
索引- 不知道如何找到哪些行没有出现在append
aapl_old
aapl_new
aapl_old
如果我需要提供更多信息,请告诉我。