如果我想计算 Pandas 中两个类别的平均值,我可以这样做:
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
我有很多以这种方式格式化的数据,现在我需要做一个T检验,看看cat1和cat2的平均值是否在统计上不同。我怎样才能做到这一点?