我有下表称为 m:
Identifier DAT_SN_e15.5_1 DAT_SN_e15.5_2 DAT_SN_p2_1 DAT_SN_p2_2
100009600 3 1 0 0
100009609 13 4 1 6
100009614 0 0 0 0
100009664 9 17 5 7
100012 0 0 0 0
100017 0 0 0 0
100019 1275 70 54 353
100033459 0 0 0 0
100034251 0 0 0 0
100034361 277 4 114 830
第 1 列是基因标识符,第 2 列和第 3 列是 DAT_SN_e15.5 的生物复制品,第 4 列和第 5 列是 DAT_SN_p2 的生物复制品。我的真实世界数据由 56 个这样的样本组成,每个样本有 2 个重复。有没有办法根据它们的名称识别复制品,唯一的区别是名称末尾的 1 或 2?
如果是这样,我如何创建一个新表 m.rep<- 平均每个标识符和每个样本的 2 个值并包含基因标识符,名为 DAT_SN_e15.5_ave 和 DAT_SN_p2_ave 的列。