我正在尝试对我的数据和估计分布执行 KS 测试拟合优度。剧情是这样的
我正在使用的代码和结果如下:
sp.stats.kstest(df['col'], 'norm', args = (mean, sd), N = 1000000)
KstestResult(统计=0.06905359838747682, pvalue=0.0)
- 从 df 我正在获取我的数据点。
- '规范',因为我假设正态分布。
- args 是一个元组
- 我使用我的数据集估计的理论分布函数的参数。
- N = 1000000 作为样本大小。
当然,拟合并不完美,但我不明白为什么 p 值只有 0.0。我是在使用该功能做错了什么还是不合适?我希望 p 值很小,甚至小到 0.01 或 0.000000536 或其他任何值,但不会完全为零。
任何想法有什么问题或可以做些什么来使它工作?
顺便说一句:原始数据最初是对数正态分布的(查看原始数据,在图中是对数转换后)