我有几个以下格式的数据org
(这里显示 a 到 d,有些有 3 个,有些有 4 个样本):
org unfiltered filtered
org_a 50.82 67.82
org_a 57.72 58.31
org_a 67.82 55.72
org_a 58.31 52.72
org_b 55.72 57.72
org_b 52.72 51.82
org_b 57.72 52.72
org_c 51.82 63.82
org_c 52.72 66
org_c 63.82 61
org_d 66 62
org_d 61 63
org_d 62 64
org_d 63 62
我已经通过手动转置数据计算mean
了每个组织的(excel 中的 AVERAGE 函数),然后是 excel 中的standard error
(STDEV.S/SQRT(COUNT(sample1:sample4)) 函数)。
org
我可以看到未过滤图和过滤图的不同之处。我正在考虑应用非配对 t 检验来获取 p 值,以分别显示不同组织之间未过滤和过滤数据的统计差异。
我在 R 中的原始数据上使用了以下代码来计算不同的参数,但无法进一步计算 t 检验。
summary(data)
aggregate(data[,2:3],by=list(org=data$org),FUN=mean)
aggregate(data[,2:3],by=list(org=data$org),FUN=sd)
dataMelt <- melt(as.data.frame(data))
g = ggplot(dataMelt)
g = g + geom_boxplot(aes(x=org,y=value))
g = g + facet_wrap(~variable)
g
箱线图没有太大帮助。我还想为过滤和未过滤的数据制作条形图,显示带有 p 值的标准误差。任何指导将不胜感激。