我在 data.table 中遇到了一个奇怪的错误消息
我使用 修改了一个 data.table :=
,它完全没问题,没有任何错误。当我尝试将代码放入函数时,会出现以下错误消息。
Error in `:=`(date, as.Date(as.character(date), "%Y%m%d") - 1) :
:= and `:=`(...) are defined for use in j, once only and in particular ways. See help(":="). Check is.data.table(DT) is TRUE.
这是可重现的示例
testdat <- data.table(ID = c(1:10), date = c(20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101), Number = rnorm(10))
# The single line command works fine.
testdat[, date := as.Date(as.character(date),"%Y%m%d") - 1][, Number:= NULL]
# But if I wrote them into a function, it failed.
# ( In this case, it worked as well.. So I got totally lost. )
test2 <- data.frame(ID = c(1:10), date = c(20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101), Number = rnorm(10))
readdata <- function(fn){
DT <- data.table(fn)
DT[, date:= as.Date(as.character(date),"%Y%m%d") - 1][, Number:= NULL]
return(DT)
}
为了更好地描述,我将部分原始代码放在这里。所以你可能明白哪里出了问题。
readdata <- function(fn){
DT <- fread(fn, sep=",")
# DT <- fread("1202.txt")
setnames(DT, paste0("V",c(1:12)), column_names)
# Modification on date
setkey(DT,uid)
DT[,date := as.Date(as.character(date),"%Y%m%d") - 1][, ignore:= NULL] #ignore is the name of one column
...}
我有一个 txt 文件列表,我想为每个文件进行计算。第一步是使用 fread,并逐个进行。假设现在我想根据“1202.txt”文件进行计算。如果我从开始DT <- fread("1202.txt")
然后继续。它不会出现这个错误。
如果我想使用readdata("1202.txt")
错误信息就出来了。最奇怪的是,我使用readdata
之前没有任何错误。
那么这里发生了什么?有什么建议么?谢谢。
> sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_United States.1252
[2] LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] data.table_1.8.11
loaded via a namespace (and not attached):
[1] tools_3.0.2
编辑
经过一些试验,我发现如果我修改代码如下,它可以工作
readdata <- function(fn){
DT <- fread(fn, sep=",")
DT <- data.table(DT) ## Just add this line compared to the original one.
# DT <- fread("1202.txt")
setnames(DT, paste0("V",c(1:12)), column_names)
# Modification on date
setkey(DT,uid)
DT[,date := as.Date(as.character(date),"%Y%m%d") - 1][, ignore:= NULL] #ignore is the name of one column
...}
那么错误是由于fread引起的吗?fread之后应该是data.table。为什么我需要使用 data.table(DT) 来转换它?
编辑
感谢关注。这是 2014 年 2 月 4 日的更新
我首先卸载了我的 1.8.11,并按照 Matt 的说明进行操作。再次从 CRAN 安装 1.8.10,然后一步一步按照他的代码。结果完全没问题,没有任何错误。
然后我卸载了 1.8.11,然后尝试使用预编译的 zip 文件再次安装 1.8.11。
像往常一样,有一条警告消息:
> install.packages("~/Desktop/data.table_1.8.11.zip", repos = NULL)
Warning in install.packages :
package ~/Desktop/data.table_1.8.11.zip?is not available (for R version 3.0.2)
Installing package into C:/Users/James/R/win-library/3.0?(as lib?is unspecified)
package data.table?successfully unpacked and MD5 sums checked
> require(data.table)
Loading required package: data.table
data.table 1.8.11 For help type: help("data.table")
看来警告信息是错误的,我加载包时完全可以。而此时,整个过程完全没问题。感谢 Matt、Arun 和所有其他热心人士的耐心。我是 data.table 的初学者。真的很感激你的好意。
还有一件事,正如我已经在此链接中报告的那样,但仍未解决。
> ?melt.data.table
No documentation for 憁elt.data.table?in specified packages and libraries:
you could try ??melt.data.table?
实在是太可惜了。有任何想法吗?
我在该链接中报告了我的 sessionInfo。我用的是Win8.1 64bit