这个问题是对上一个问题的跟进。
我有一个 id 的向量sampleIDs
。我还有一个 data.table ,rec_data_table
由 bid 键入并包含一列,
A_IDs.list
其中每个元素都是 aID 的集合(向量)。
我想创建第二个 data.table ,其中包含sampleIDs
和 where
For each aID
,有一个对应的所有 bID 的向量,
该 aID 出现在A_IDs.list
列中。
例子:
> rec_data_table
bid counts names_list A_IDs.list
1: 301 21 C,E 3,NA
2: 302 21 E NA
3: 303 5 H,E,G 8,NA,7
4: 304 10 H,D 8,4
5: 305 3 E NA
6: 306 5 G 7
7: 307 6 B,C 2,3
> sampleIDs
[1] 3 4 8
AB.dt <- data.table(aID=sampleIDs, key="aID")
# unkown step
AB.dt[ , bIDs := ???? ]
# desired result:
> AB.dt
aid bIDs
1: 3 301,307
2: 4 304
3: 8 303,304
AB.dt[]
我在通话中尝试了几条不同的线路。我能得到的最接近的是
rec_data_table[sapply(A_IDs.list, function(lst) aID %in% lst), bID]
这将为我提供给定的所需结果aID
,我可以重复创建向量列表并构建所需的结果。sampleIDs
但是,我怀疑必须有一个更“适合 data.table”的方法来实现这一点。任何建议表示赞赏。
#--------------------------------------------------#
# SAMPLE DATA #
library(data.table)
set.seed(101)
rows <- size <- 7
varyingLengths <- c(sample(1:3, rows, TRUE))
A <- lapply(varyingLengths, function(n) sample(LETTERS[1:8], n))
counts <- round(abs(rnorm(size)*12))
rec_data_table <- data.table(bID=300+(1:size), counts=counts, names_list=A, key="bID")
A_ids.DT <- data.table(name=LETTERS[c(1:4,6:8,10:11)], id=c(1:4,6:8,10:11), key="name")
rec_data_table[, A_IDs.list := sapply(names_list, function(n) c(A_ids.DT[n, id]$id))]
sampleIDs <- c(3, 4, 8)