3

这是一个功能

f <- function(orderData){
        colNames <- paste0("lim_",sort(unique(orderData[,XLM])))
        orderData[, (colNames):={lim_=factor(XLM);lapply(data.table(model.matrix(~ lim_:w_qalim + 0)), cumsum)}]
}

和一些样本数据

dt = data.table(XLM=sample(1L:300L,5e4,T), w_qalim=sample(1L:5L,5e4,T))
dt1 = data.table(XLM=sample(1L:300L,1e2,T), w_qalim=sample(1L:5L,1e2,T))

执行f(dt)不会dt在我的盒子上通过引用更新,但f(dt1)会更新。是否预期/与datatable.alloccol

4

1 回答 1

4

在这两种情况下,数据表的长度都是 2,真实长度是 100:

> length(dt); truelength(dt)
[1] 2
[1] 100
> length(dt1); truelength(dt1)
[1] 2
[1] 100

但是,在dt colNamesis 300 的情况下,2+300 超过了真实长度,但在dt1 colNamesis 81 的情况下,2+81 不会。

您可以提前分配更大的真实长度,例如

alloc.col(dt, 1000)

或者您可以设置默认值,以便所有数据表具有更大的默认值:

options(datatable.alloccol = 1000)

?alloc.col

于 2013-04-24T19:15:23.953 回答