df
我有一个具有多级索引的示例 Pandas 数据框:
>>> df
STK_Name ROIC mg_r
STK_ID RPT_Date
002410 20111231 ??? 0.401 0.956
300204 20111231 ??? 0.375 0.881
300295 20111231 ???? 2.370 0.867
300288 20111231 ???? 1.195 0.861
600106 20111231 ???? 1.214 0.857
300113 20111231 ???? 0.837 0.852
并stk_list
定义为stk_list = ['600106','300204','300113']
我想获取df
sub_level 索引STK_ID
值在stk_list
. 输出如下:
STK_Name ROIC mg_r
STK_ID RPT_Date
300204 20111231 ??? 0.375 0.881
600106 20111231 ???? 1.214 0.857
300113 20111231 ???? 0.837 0.852
基本上,我可以通过以下方式实现此示例数据的目标:
df = df.reset_index() ; df[df.STK_ID.isin(stk_list)]
但是我的应用程序数据框中已经有列“STK_ID”和“RPT_Date”,所以 reset_index() 会导致错误。无论如何,我想直接过滤索引而不是列。
我尝试df[df.index.map(lambda x: x[0].isin(stk_list))]
了,Pandas 0.8.1 给出了AttributeError: 'unicode' object has no attribute 'isin'
,
reset_index()
我的问题:我应该如何在不使用&方法的情况下通过检查列表中的子级索引值来过滤 Pandas 数据帧的行set_index()
?