0

我想看看我的数据中组间的差异是否具有统计学意义。

如何使用这样的长格式数据运行卡方检验

Country        Year     Value
Country A       1         2
Country A       2         3
Country A       3         3
Country B       1         6
Country B       2         7
Country B       3         6
Country C       1         9
Country C       2         8
Country C       3         9

我不知道如何对同一个变量但针对不同的组(国家)运行卡方检验。

谢谢

4

2 回答 2

1

对于像这样的大多数统计测试,您需要将数据从长格式重新格式化为适当的宽格式。我喜欢这个reshape2包来帮助处理这些事情。

例如:

> x <- read.table(text = "Country        Year     Value
+ Country.A       1         2
+ Country.A       2         3
+ Country.A       3         3
+ Country.B       1         6
+ Country.B       2         7
+ Country.B       3         6
+ Country.C       1         9
+ Country.C       2         8
+ Country.C       3         9", header = TRUE)
> 
> 
> library(reshape2)
> wide <- dcast(x, Country ~ Year, value.var = "Value")
> wide
    Country 1 2 3
1 Country.A 2 3 3
2 Country.B 6 7 6
3 Country.C 9 8 9

现在它更接近于chisq.test()您可能有兴趣运行的任何其他测试或任何其他测试所需的格式。第一行包含最有可能需要从分析中排除的 Country 列,因为它与计数无关:

> wide[, -1]
  1 2 3
1 2 3 3
2 6 7 6
3 9 8 9

我将由您决定哪种测试适合您的数据。

于 2012-04-02T22:22:17.283 回答
0

您尚未指定要测试的假设,因此尚无法应用“卡方检验”。(您指定了一个您不确定实施的特定案例这一事实表明他可能是家庭作业。)从您提供的数据中可以清楚地看出,这些行根本不是独立的。您只有三个国家,然后在连续时间间隔内重复测量具有整数值的事物。这些算不算?如果这是为了讨论目的而简化更丰富的数据集,那么您需要修改您的问题并努力构建一个现实的测试用例,以便可以提供实质性的评论

于 2012-04-02T22:26:46.203 回答