在不同月份测试来自同一事实的两个样本之间的拟合优度。我想知道 9 月的 4 个类别的结果是否与 10 月相似/不同。
问题是我的测试在使用列联表与将上个月作为预期比例的预期比例时给了我不同的结论。
样本数据:
data <-data.frame(september=c(10741, 1575, 174, 2),
october= c(11987, 1705, 211, 2),
row.names = c("A", "B", "C", "D"))
> data
september october
A 10741 11987
B 1575 1705
C 174 211
D 2 2
使用列联表测试通常的方法:
> chisq.test(data)
Pearson's Chi-squared test
data: data
X-squared = 1.3846, df = 3, p-value = 0.7092
从 9 月开始计算比例并将其设置为预期概率:
p <- data$september %>% prop.table()
[1] 0.8598302914 0.1260806916 0.0139289145 0.0001601025
chisq.test(x=data$october, p = p)
Chi-squared test for given probabilities
data: data$october
X-squared = 2.9748, df = 3, p-value = 0.3955
为什么在测试中有这样的差异?哪一个是错的?我认为这两种策略会导致相同的结果,但似乎是一个错误。