我正在使用 Python 的非参数测试来检查两个样本是否与从相同的潜在父群体中抽取一致:scipy.stats.ks_2samp
(2-sample Kolmogorov-Smirnov)、scipy.stats.anderson_ksamp
(Anderson-Darling for k samples)和scipy.stats.ranksums
(Mann-Whitney- Wilcoxon 用于 2 个样品)。我说两个样本之间存在显着差异的显着性阈值是 p = 0.01。
如果这三个测试返回极低的 p 值(有时像 10^-30 或更低),那么我是否需要担心 scipy 函数出了问题?这些小得离谱的 p 值是否可靠,我可以只报告 p << 0.01(p 远小于我的阈值)吗?