我有以下 csv 格式的表格:
我在 csv 格式表中有以下基因信息:
1 3 1 2 2 3
1415670_at 1 365.1 293.4 288.9 394.5 312 381.6
1415671_at 2 556.1 584.2 567.8 592.8 471.6 513.1
1415672_at 3 1048.3 763.1 1074.9 852.3 826.1 898.3
1415673_at 4 60.8 51.7 51.6 224 248.4 150.7
1415674_at 5 129.1 107.2 230.4 175.5 250.5 172.4
如您所见,我得到了一些标有 1,2 和 3 的列。我制作了一个 VB 脚本,用于删除 Excel 中不同于 1 和 2 的列。我的问题是如何仅使用 R 来做到这一点?这样我的结果表将是:
1 1 2 2
1415670_at 1 365.1 293.4 394.5 312
1415671_at 2 556.1 584.2 592.8 471.6
1415672_at 3 1048.3 763.1 852.3 826.1
1415673_at 4 60.8 51.7 224 248.4
1415674_at 5 129.1 107.2 175.5 250.5
顺便说一句,这只是一个示例,我可以将其他列标记为 4、5 和 6,但我只想保留标记为 1 和 2 的列
我已经尝试过发布的解决方案,即使用:
m<-read.csv("test1.csv")
smallerdat <- m[ grep("^X1$|^X2$|X1\\.|X2\\." , names(m) ) ]
其中 m 是 csv 格式的表格,但我得到的结果是:
X1 X1.1 X2 X2.2
365.1 293.4 394.5 312
556.1 584.2 592.8 471.6
1048.3 763.1 852.3 826.1
60.8 51.7 224 248.4
129.1 107.2 175.5 250.5
所以它正在删除我需要的前两列。如何不删除这些列?以及如何保持原始格式,我的意思是标题中只有 1 和 2 而不是那些 X