13

我有一个包含两个数字行的表,其中一个设置为键。我想data.table按数字键值对我的子集进行分组,但它似乎不起作用。当我将其转换为字符时,它可以工作。

你能帮我理解为什么会这样吗?我正在使用 data.table 1.8.6。

谢谢一堆。这是测试代码:

> ID <-c(rep(210, 9), rep(3917,6))
> Count <- c(1,1,0,1,1,1,1,1,1,1,1,1,1,0,1)
> x <- data.table(ID, Count)
> 
> # numeric key doesn't work with i argument
> setkey(ID)
 [1]  210  210  210  210  210  210  210  210  210 3917 3917 3917 3917 3917 3917
> x[210,list(ID, Count)]
   ID Count
1: NA    NA
> 
> # create character key
> x$charID <- as.character(x$ID)
> setkey(x, charID)
> x["210",list(ID, Count)]
   charID  ID Count
1:    210 210     1
2:    210 210     1
3:    210 210     0
4:    210 210     1
5:    210 210     1
6:    210 210     1
7:    210 210     1
8:    210 210     1
9:    210 210     1
4

2 回答 2

17

您需要在 data.table 中发送数字键。这很容易使用J. 或在列表中

请注意,您需要在设置密钥时指定 data.table,例如

setkey(x, ID)
x[J(210)]
    ID Count
1: 210     1
2: 210     1
3: 210     0
4: 210     1
5: 210     1
6: 210     1
7: 210     1
8: 210     1
9: 210     1

或者

x[list(210)]
    ID Count
1: 210     1
2: 210     1
3: 210     0
4: 210     1
5: 210     1
6: 210     1
7: 210     1
8: 210     1
9: 210     1
于 2012-12-02T05:06:30.273 回答
5

当您询问 R 时,x[210, ]它正在寻找x.
如果x有 210 多行,它将返回该值(尽管不是您想要的行)。由于没有第 210 行,它给你 NA。

当您改为要求时x['210', ],它正在寻找x标签中的行'210'



试试这个看看差异:

 vec <- LETTERS[1:9]
 names(vec) <- c(11:18, 1)

现在比较:

 vec[[11]]
 vec[['11']]


 vec[[1]]
 vec[['1']]
于 2012-12-02T04:26:03.683 回答