我制作了一些示例数据和示例图表来显示我需要做什么。
example.label <- c("A","B")
example.percent.good <- c(.75,.6)
example.data <- data.frame(example.label,example.percent.good)
example.data$example.percent.bad <- (1-example.data$example.percent.good)
example.data ##looks like this
example.label example.percent.good example.percent.bad
1 A 0.75 0.25
2 B 0.60 0.40
然后我融合了数据,以便能够使用 reshape 包绘制它。
example.melt <- melt(example.data,id.vars="example.label")
example.melt$labelposition <-
ifelse(example.melt$variable=="example.percent.bad", example.melt$value/2, 1 - example.melt$value/2)
##This just creates where the graph should place the labels
然后数据看起来像这样......
example.label variable value labelposition
1 A example.percent.good 0.75 0.625
2 B example.percent.good 0.60 0.700
3 A example.percent.bad 0.25 0.125
4 B example.percent.bad 0.40 0.200
然后我需要做的是确定这些比率之间差异的统计显着性。显然,在我的实际数据中,比率来自某个地方,但这里只是百分比,以简化问题,因此在这个特定示例中没有任何意义。
用于确定这些比率之间的差异是否具有统计显着性的正确统计分析是什么,以及如何在 R 中实现这一点?基本上,标签 A 中的 75%/25% 与标签 B 中的 60%/40% 是否具有统计学意义?
我不知道这是否是问这个问题的正确地方。谢谢!