我正在比较两个分布,例如:
group1 = [ 0, 0, 0, 1, 11, 11, 13, 12]
group2 = [ 0, 0, 0, 0, 5, 11, 18, 14]
我的分布没有很多元素,我不确定卡方是否是最好的方法,但从我读到的内容来看,我认为它仍然是我见过的最好的测试。
问题是,无论我尝试哪种卡方,我都会得到不同的结果:
所以如果我使用:
import numpy as np
import scipy.stats.mstats as mst
mst.chisquare(np.array(group1), np.array(group2))
答案将是:(8.874603174603175, 0.26178489290758555)
如果我使用:
import scipy.stats as stat
stat.chisquare(np.array(group1), np.array(group2))
我会得到:(nan, nan)
如果我删除两个组中所有为 0 的元素,以便我的组现在看起来像这样:
group1 = [ 1, 11, 11, 13, 12]
group2 = [ 0, 5, 11, 18, 14]
使用:
mst.chisquare(np.array(group1), np.array(group2))
会给我:(8.874603174603175, 0.06431137995249224)
我对这种模棱两可感到很困惑。我的分布的真实 p 值是多少?