0

我正在使用 edgeR 和 Limma 包来分析 RNA-seq 计数数据表。我只需要数据文件的一个子集,因此我的问题是:我是否需要在所有样本中规范化我的数据,还是先对我的数据进行子集化然后再规范化数据更好。

谢谢你。

问候丽莎娜

4

1 回答 1

0

我认为这取决于您要证明/展示的内容。如果您还想考虑您的“暗计数”,那么您应该首先对其进行标准化,以便您还考虑实验失败的百分比。在这里,您的实验总数(好的和坏的结果)总计为 1。

如果您想找出“好事件”的分布,那么您应该首先生成好样本的子集,然后进行归一化。在这种情况下,您的好事件数总计为 1

所以再一次,这取决于你想证明什么。作为物理学家,我更喜欢第一种方法,因为我们不会删除坏数据点。

干杯 TL

于 2013-06-06T13:25:22.123 回答