r - 将超大 OTU（丰度）表从宽格式改造成长格式 - 400,000 个观测值

Question

我有一个非常大的 OTU（丰度）表。每个样本（4000 个分类单元）有 100 多个样本和 4000 个观测值。

OTU 表的示例如下：

#OTUID  1   2   3   4   5   6   7   8
OTU1    0   0   0   0   0   3   0   0
OTU2    0   0   0   0   0   0   13  0
OTU3    5   99  0   0   0   0   0   0
OTU4    0   0   0   0   0   0   0   0
OTU5    0   0   0   0   0   0   0   2
OTU6    0   0   19  0   9   236 59  2
OTU7    0   55  0   2   4   2   3   0
OTU8    0   44  10  5   0   0   7   0
OTU9    6   0   13  2   0   0   17  6
OTU10   0   100 0   0   0   3   0   0
OTU11   4   13  0   0   2   1   2   0
OTU12   0   0   0   0   0   101 1   0

我想以长格式获取此表，以便我可以在另一个表上的样本之间执行一些成对测试。我只对计数数据感兴趣，尽管如果我可以拥有它们属于两个的样本和相应的 OTU，我会接受它，但没有必要。数据应如下所示：

COUNT OTUID SAMPLEID
0     OTU1   1
0     OTU2   1
5     OTU3   1
0     OTU4   1
0     OTU5   1
0     OTU6   1
0     OTU7   1
0     OTU8   1
6     OTU9   1
0     OTU10  1
4     OTU11  1
0     OTU12  1
0     OTU1   2
0     OTU2   2
99    OTU3   2
0     OTU4   2

我的脚本似乎可以工作，尽管我确实收到了 NO id variable 错误消息，但它仍在运行。如果有人知道如何解决这个问题，我将不胜感激。

library(reshape2)
test = read.csv("test_otu.csv", sep=",", row.names=1)
test2 <- melt(test)
No ID variables; using all as measure variables
test2

请帮忙！

r - 将超大 OTU（丰度）表从宽格式改造成长格式 - 400,000 个观测值

0 回答 0

Related

Reference