我已经对一些数据拟合了高斯分布和高斯混合分布,并根据经验数据绘制了模型 CDF,如下所示:
我试图使用 kstest 来量化和比较每个模型的拟合优度,但查看 scipys kstest 文档让我感到困惑。我是否像在其他帖子上看到的那样使用 kstest 或 ks_2samp?
编辑:对于上下文,我为一个示例 kstest 尝试过的代码是
ss.kstest(Y, y_cdf)
其中 Y 是数据,y_cdf 是混合模型的 cdf,但是这给出了 1 个分量的 d 值低于 2 个分量的值,我很清楚 2 个分量的混合模型更适合,所以不应该 kstest 的 D 值更低?