我们如何使用它们的数字索引(位置)的向量来选择多列data.table
?
这就是我们对 a 的处理方式data.frame
:
df <- data.frame(a = 1, b = 2, c = 3)
df[ , 2:3]
# b c
# 1 2 3
我们如何使用它们的数字索引(位置)的向量来选择多列data.table
?
这就是我们对 a 的处理方式data.frame
:
df <- data.frame(a = 1, b = 2, c = 3)
df[ , 2:3]
# b c
# 1 2 3
对于data.table >= 1.9.8
的版本,以下所有内容都可以正常工作:
library(data.table)
dt <- data.table(a = 1, b = 2, c = 3)
# select single column by index
dt[, 2]
# b
# 1: 2
# select multiple columns by index
dt[, 2:3]
# b c
# 1: 2 3
# select single column by name
dt[, "a"]
# a
# 1: 1
# select multiple columns by name
dt[, c("a", "b")]
# a b
# 1: 1 2
对于data.table < 1.9.8
的版本(需要使用数字列选择with = FALSE
),请参阅此答案的此先前版本。另见关于 v1.9.8 的新闻,潜在的重大变化,第 3 点。
这有点冗长,但我已经习惯了使用隐藏.SD
变量。
b<-data.table(a=1,b=2,c=3,d=4)
b[,.SD,.SDcols=c(1:2)]
这有点麻烦,但是您不会失去其他 data.table 功能(我不认为),因此您仍然应该能够使用其他重要功能,例如连接表等。
如果要使用列名来选择列,只需使用.()
,它是 的别名list()
:
library(data.table)
dt <- data.table(a = 1:2, b = 2:3, c = 3:4)
dt[ , .(b, c)] # select the columns b and c
# Result:
# b c
# 1: 2 3
# 2: 3 4
从 v1.10.2 开始,您还可以使用..
dt <- data.table(a=1:2, b=2:3, c=3:4)
keep_cols = c("a", "c")
dt[, ..keep_cols]
@Tom,非常感谢您指出这个解决方案。这对我很有效。
我正在寻找一种方法来从打印和上面的示例中排除一列。要排除第二列,您可以执行以下操作
library(data.table)
dt <- data.table(a=1:2, b=2:3, c=3:4)
dt[,.SD,.SDcols=-2]
dt[,.SD,.SDcols=c(1,3)]