我正在处理生物信息学数据,每行都有一个基因,列中有统计信息/元数据。一些基因来自同一生物体,由“ID”列指示,我将数据分组在这个变量上。
data <- data %>%
group_by(ID)
我想根据 ID(分组因子)添加来自另一个文件的数据,以便 ID = a 的行应该具有来自名为 a.gff 的文件的数据,依此类推。我想添加的数据来自一个包含基因位置的 .gff 文件。有一个 ID=a 的 gff 文件,一个 ID=b 的文件,一个 ID=c 的文件,等等根据 ID 命名(例如“a.gff”)。
数据是什么样子的:
基因 | ID |
---|---|
赛拉 | 一个 |
细胞 | 一个 |
Atl | b |
prT | 一个 |
胡尔 | C |
有没有办法实现为每个 ID 分组打开文件、执行操作并移动到下一个 ID 的功能?
我对 R 很陌生,非常感谢任何帮助!