1

我在使用data.tableand integer64(package bit64)> 时遇到了很多困难,我的理解是,integer64它还不能在by子句中使用。虽然我可能在“ sort”中发现了一个错误。

library(data.table)
library(bit64)

test4 <- structure(list(IDFD = c("360627720722618433", "360627720722618433"
), CDVCA = c("2013-03-13T09:36:07.795", "2013-03-13T09:36:07.795"
), NUMSEQ = structure(c(1.05397451390436e-309, 1.05397443975625e-309
), class = "integer64")), .Names = c("IDFD", "CDVCA", "NUMSEQ"
), row.names = c(NA, -2L), class = "data.frame")

str(test4)
'data.frame':   2 obs. of  3 variables:
 $ IDFD  : chr  "360627720722618433" "360627720722618433"
 $ CDVCA : chr  "2013-03-13T09:36:07.795" "2013-03-13T09:36:07.795"
 $ NUMSEQ:Class 'integer64'  num [1:2] 1.05e-309 1.05e-309

test4 <- as.data.table(test4)

str(test4)
Classes ‘data.table’ and 'data.frame':  2 obs. of  3 variables:
 $ IDFD  : chr  "360627720722618433" "360627720722618433"
 $ CDVCA : chr  "2013-03-13T09:36:07.795" "2013-03-13T09:36:07.795"
 $ NUMSEQ:Class 'integer64'  num [1:2] 1.05e-309 1.05e-309
 - attr(*, ".internal.selfref")=<externalptr> 

setkey(test4,IDFD,CDVCA,NUMSEQ)
test4
                 IDFD                   CDVCA          NUMSEQ
1: 360627720722618433 2013-03-13T09:36:07.795 213326816542720
2: 360627720722618433 2013-03-13T09:36:07.795 213326801534975 #THIS IS NOT SORTED !!

我对吗 ?

4

2 回答 2

2

更新:这现在在 v1.9.3 中实现(可从 R-Forge 获得),请参阅新闻

o bit64::integer64现在可用于分组和连接,#5369。感谢 James Sams 强调 UPC 和 Clayton Stanley。
提醒:fread()已经能够检测和读取integer64一段时间了。

在上面的 OP 示例中:

test4
#                  IDFD                   CDVCA          NUMSEQ
# 1: 360627720722618433 2013-03-13T09:36:07.795 213326801534975 ## sorted right
# 2: 360627720722618433 2013-03-13T09:36:07.795 213326816542720
于 2014-05-09T13:53:12.937 回答
0

您可以通过执行以下操作来解决此问题,而无需更改字段值:

df[order(as.numeric(as.character(myint64field)), myotherfield),]

显然,你会受到性能打击。

于 2021-01-11T16:20:59.223 回答