我正在尝试确定今天的数据是否真的与昨天的四个类别不同。
我统计的数据是:
data <-data.frame(yesterday=c(10741, 1575, 174, 2),
today = c(11987, 1705, 211, 2),
row.names = c("a", "b", "c", "unknown"))
> data
yesterday today
a 10741 11987
b 1575 1705
c 174 211
unknown 2 2
所以我以这种方式使用 stats 包中的卡方进行测试:
stats::chisq.test(x = data$yesterday, y = data$today)
结果是:
Pearson's Chi-squared test
data: data$yesterday and data$today
X-squared = 12, df = 9, p-value = 0.2133
我的问题是我认为这应该与以下内容相同:
stats::chisq.test(data)
但是你可以看到结果完全不同。
Pearson's Chi-squared test
data: data
X-squared = 1.3846, df = 3, p-value = 0.7092
所以......这是使用此测试比较来自同一数据集的两个样本的正确方法?