我有两个熊猫数据框:dfLeft 和 dfRight,以日期为索引。
df左:
cusip factorL
date
2012-01-03 XXXX 4.5
2012-01-03 YYYY 6.2
....
2012-01-04 XXXX 4.7
2012-01-04 YYYY 6.1
....
右:
idc__id factorR
date
2012-01-03 XXXX 5.0
2012-01-03 YYYY 6.0
....
2012-01-04 XXXX 5.1
2012-01-04 YYYY 6.2
两者的形状都接近(121900,3)
我尝试了以下合并:
test = pd.merge(dfLeft, dfRight, left_index=True, right_index=True, left_on='cusip', right_on='idc__id', how = 'inner')
这给了 test 的形状(60643500, 6)
。
关于这里出了什么问题的任何建议?我希望它基于日期和 cusip/idc_id 合并。注意:在这个例子中,尖点是一字排开的,但实际上可能并非如此。
谢谢。
预期输出测试:
cusip factorL factorR
date
2012-01-03 XXXX 4.5 5.0
2012-01-03 YYYY 6.2 6.0
....
2012-01-04 XXXX 4.7 5.1
2012-01-04 YYYY 6.1 6.2