有没有人建议如何根据存储在第二个数据集中的元数据从数据集中提取列?只是想知道是否有一种相对简单的方法(例如使用“colnames”或“subset”)。我的原始数据集非常大,有 100 多列和 30,000 多行。打开文件并在 Excel 中选择是一种痛苦。
这里有两个示例数据集:
set1 <- data.frame(ID = rnorm(5, 5000, 1000), Sample1 = rnorm(5, 50000, 2500),
Sample2 = rnorm(5, 50000, 2500), Sample3 = rnorm(5, 50000, 2500),
Sample4 = rnorm(5, 50000, 2500), Sample5 = rnorm(5, 50000, 2500))
meta.data <- data.frame(Sample_name = c("Sample1", "Sample2", "Sample3",
"Sample4", "Sample5"), Location = c("Loc1", "Loc2", "Loc3", "Loc1", "Loc1"),
Time = c("M0", "M01", "M02", "M02", "M03"),
Conc = c("lo", "hi", "lo", "lo", "lo"))
(1) 我怎样才能提取(作为一个新的数据集)位置 Loc1 的所有样本或时间 M02 的所有样本?
(2) 如何提取具有特定 ID 号的行并仅选择该行中具有 Conc“lo”的样本?