3

我希望对两个 DataFrame 的汇总统计数据进行均值测试。

df1[['sd']].describe()
                sd
count  5000.000000
mean      0.635558
std       0.086109
min       0.492922
25%       0.577885
50%       0.639906
75%       0.688645
max       0.800767

df2[['sd']].describe()
                sd
count  5000.000000
mean      0.640954
std       0.084459
min       0.496823
25%       0.577373
50%       0.644122
75%       0.693863
max       0.798076

我正在寻找一些可以调用这些汇总统计数据的函数,以告诉我我的均值差异是否具有统计显着性。

4

1 回答 1

4

如果您观察到来自相同或不同总体的两个独立样本,则对独立样本执行 t 检验。

这是对两个独立样本具有相等平均值的原假设的双边检验。

from scipy.stats import ttest_ind

ttest_ind(df1['sd'], df2['sd'])

输出将是 t 统计量和 p 值。

于 2020-03-02T20:21:43.357 回答