我必须测试两个样本的分布以检查它是否相同,所以我使用了ks_2samp
Scipy 的 Kolmogorov-Smirnov 测试。两个样本中的数据是连续的,但我将它们分箱以用于绘图目的。
我知道 KS 不适用于分箱样本,但我试图看看在测试分箱数据时会发生什么。即,我为每个 bin 分配了一个字母,并传递给ks_2samp
两个数组,其中的字母对应于数据点所属的 bin。
为什么如果我更改 KS 测试的箱数(几乎)为统计量和 p 值产生相同的值?例如,如果我减少 bin 的数量,则生成的直方图(因此 pdf)会改变形状,所以我预计测试结果会有所不同。
此外,哪种统计测试最适合测试两个分箱数据样本的分布?
谢谢!