我正在尝试重现我在研究论文中发现的分析(转录组分析)。方法部分说:
标准化后,计算每个细胞系的表达阈值,以消除可被视为技术噪声的低强度探针。首先,探针组通过增加表达值进行排序。对于每个探针组,进行 t 检验以评估该探针组与具有较少表达值的探针组的中值之间的差异表达。
我在 R 中使用了 shorth 函数来重现这个分析,我想知道你是否认为这是一种合适的方法。
我的数据来自 Affymetrix Hugene 1.1 st 数组。使用 RMA (dat)标准化后,我执行以下代码以获得表达较少的探针集:
med.exp <- rowMedians(exprs(dat))
med <- shorth(med.exprs)
然后,我计算了一个t.test
用于将每个探针组与med值进行比较的
tt <- rep(0.8256, 23) ## 0.8256 is the value of *shorth(med.exprs)* and I have 23 samples
result.pvalue <- sapply(1:nrow(myAB1_rma.exprs), function(i) t.test(dat[i,], tt))
这种方法可能有效吗?
提前谢谢了,
胡安