我有一个非常大的 OTU(丰度)表。每个样本(4000 个分类单元)有 100 多个样本和 4000 个观测值。
OTU 表的示例如下:
#OTUID 1 2 3 4 5 6 7 8
OTU1 0 0 0 0 0 3 0 0
OTU2 0 0 0 0 0 0 13 0
OTU3 5 99 0 0 0 0 0 0
OTU4 0 0 0 0 0 0 0 0
OTU5 0 0 0 0 0 0 0 2
OTU6 0 0 19 0 9 236 59 2
OTU7 0 55 0 2 4 2 3 0
OTU8 0 44 10 5 0 0 7 0
OTU9 6 0 13 2 0 0 17 6
OTU10 0 100 0 0 0 3 0 0
OTU11 4 13 0 0 2 1 2 0
OTU12 0 0 0 0 0 101 1 0
我想以长格式获取此表,以便我可以在另一个表上的样本之间执行一些成对测试。我只对计数数据感兴趣,尽管如果我可以拥有它们属于两个的样本和相应的 OTU,我会接受它,但没有必要。数据应如下所示:
COUNT OTUID SAMPLEID
0 OTU1 1
0 OTU2 1
5 OTU3 1
0 OTU4 1
0 OTU5 1
0 OTU6 1
0 OTU7 1
0 OTU8 1
6 OTU9 1
0 OTU10 1
4 OTU11 1
0 OTU12 1
0 OTU1 2
0 OTU2 2
99 OTU3 2
0 OTU4 2
我的脚本似乎可以工作,尽管我确实收到了 NO id variable 错误消息,但它仍在运行。如果有人知道如何解决这个问题,我将不胜感激。
library(reshape2)
test = read.csv("test_otu.csv", sep=",", row.names=1)
test2 <- melt(test)
No ID variables; using all as measure variables
test2
请帮忙!