1

我们得到一个包含 2 列(样本、实验条件)和n行(例如基因)的矩阵,我们的目标是识别两个样本之间(在特定 FDR 处)发生显着变化的基因。

如何使用 R 执行此操作?

下面是fdrtool包手册中的一个示例,它显示了如何从 p 值向量计算 FDR:

library("fdrtool") 
data(pvalues)
fdr = fdrtool(pvalues, statistic="pvalue") 
fdr$qval # estimated Fdr values 
fdr$lfdr # estimated local fdr

但问题是我们这里只有两个观察向量,而不是 p 值。有任何想法吗?

这是可以使用的示例数据:foo <- matrix(runif(1000), ncol=2)

我假设我们没有重复信息、p 值等。但可以肯定的是,两个样本之间值相差很大的基因肯定有更强有力的证据。在这种情况下有没有办法分配 FDR?

4

1 回答 1

1

如果每个条件都有一个样本,则无法获得 pvalue,因为这是为一个总体抽取的样本之间的差异在统计上不同的概率。但是,如果每个基因都没有重复,没有均值,没有方差,据我所知,我们无法估计抽样误差,因此对于常规值,没有如何区分您看到的值与随机值小样本检验,如 t 检验。看看这个,它可能会有所帮助:

http://en.wikipedia.org/wiki/P-value

http://www-stat.stanford.edu/~tibs/SAM/

你可以做的是一个 MA 图

http://en.wikipedia.org/wiki/MA_plot

并查看您的数据分布,哪些是最大的差异,然后选择那些。但是,这不在错误发现率分析的统计框架内,它可能作为探索性分析有所帮助,但其中没有真正的统计数据。在微阵列文献中,您可能会找到替代方案,做出一组假设并进行假设检验,但我不知道有一个可以表明,也许 affy 包有一个......

在此处输入图像描述

于 2013-06-08T15:26:43.690 回答