我是初学者,我似乎无法找到确切的答案。
我有两个数据框,第一个有本地化的经济数据(df1):
(index) (index) 2000 2010 Diff
State Region
NY NYC 1000 1100 100
NY Upstate 200 270 70
NY Long_Island 1700 1800 100
IL Chicago 300 500 200
IL South 50 35 15
IL Suburbs 800 650 -150
第二个有一个州和地区列表,(df2):
index State Region
0 NY NYC
1 NY Long_Island
2 IL Chicago
最终,我想要做的是在州和地区之间t-test
的列上运行 a与所有其他不包括在. 但是,我还没有设法划分组,所以我无法运行测试。Diff
df2
df1
df2
我最近的尝试(很多)看起来像这样:
df1['Region', 'State'].isin(df2['Region', 'State'])
我也尝试pd.merge
过,但似乎无法正常工作。我认为这是因为多级索引,但我仍然不知道如何获取不在df2
.