34

我正在尝试将函数应用于大型 data.table 中的一组列,而不是单独引用每个列。

a <- data.table(
  a=as.character(rnorm(5)),
  b=as.character(rnorm(5)),
  c=as.character(rnorm(5)),
  d=as.character(rnorm(5))
)
b <- c('a','b','c','d')

使用上面的 MWE,这个:

a[,b=as.numeric(b),with=F]

有效,但这:

a[,b[2:3]:=data.table(as.numeric(b[2:3])),with=F]

不起作用。as.numeric将函数仅应用于第2 列和第 3 列a而不单独引用它们的正确方法是什么。

(在实际数据集中有几十列,所以这是不切实际的)

4

1 回答 1

46

惯用的方法是使用.SD.SDcols

您可以通过包装来强制在父框架​​中评估 RHS()

a[, (b) := lapply(.SD, as.numeric), .SDcols = b]

对于列 2:3

a[, 2:3 := lapply(.SD, as.numeric), .SDcols = 2:3]

或者

mysubset <- 2:3
a[, (mysubset) := lapply(.SD, as.numeric), .SDcols = mysubset]
于 2013-05-28T04:17:21.100 回答