r - 执行半反连接（在二进制搜索中）

Question

我想data.table通过选择第一个键并排除第二个键来对 a 进行子集化。

set.seed(18032)
DT <- data.table(grp1 = sample(10, 1000, T),
                 grp2 = sample(10, 1000, T),
                 v = rnorm(100), key = "grp1,grp2")

我的第一直觉没有奏效（!操作太早）：

DT[.(10, !10)] #!10 = 0, chooses the (10,0) subset

这似乎太不雅了，但有效：

DT[.(10, setdiff(unique(grp2), 10))] #unique(grp2) %\% 10 for the bold ;-)

这也有效，但这种方法牺牲了一些功能（例如，访问:=on DT）：

setkey(DT, grp2, grp1)
DT[!.(10)][CJ(grp2, 10, unique = TRUE)]
#equivalently
DT[!.(10)][.(unique(grp2), 10)]

我是否已经用尽了我的选择，或者我错过了什么？

score 2 · Accepted Answer

这似乎符合我的预期：

DT[ grp1==10 & grp2 != 10, ]

:=如果您在 j 位置使用，它似乎允许有针对性的分配。

例如，这应该会成功（不会降低效率）：

 DT[ grp1==10 & grp2 != 10, v := 0 ]

r - 执行半反连接（在二进制搜索中）

1 回答 1

Related

Reference