非常简单的测试:
- 使用泊松分布生成数字的随机分布。使用 KS 检验确定它是否与泊松分布匹配。
- 使用泊松分布生成 (x2) 随机数字分布。使用 (x2) 边 KS 测试来确定它们是否相同。
从上面看,(1) 给出了一个低p 值,而 (2) 给出了一个高p 值。为什么?
代码 1
from scipy.stats import kstest, poisson
noPts = 1000
lambdaPoisson = 10
my_data = poisson.rvs(size = noPts, mu = lambdaPoisson)
ks_statistic, p_value = kstest(my_data, 'poisson', args=(lambdaPoisson,0))
print(ks_statistic, p_value)
结果: 0.1239297144718523 7.61680985798287e-14
代码 2
from scipy.stats import ks_2samp, poisson
noPts = 1000
lambdaPoisson = 10
my_data1 = poisson.rvs(size = noPts, mu = lambdaPoisson)
my_data2 = poisson.rvs(size = noPts*1000, mu = lambdaPoisson)
ks_statistic, p_value = ks_2samp(my_data1, my_data2)
print(ks_statistic, p_value)
结果: 0.023672000000000026 0.6301973762116004