20

我有以下双值向量x,其中每个元素代表一个 POSIX 日期时间

x <- c(1417621083, 1417621204, 1417621384, 1417621564, 1417621623)

我正在使用RJSONIO包,并希望继续这样做。

作为练习,我想将这些值转换为 JSON 文本,然后再次将它们读回 R,但是在将日期时间表示转换为一个很好的简化列表结果时遇到了麻烦。在 JSON 中,日期需要采用特殊格式,以便将其中的值x转换为以下内容:

dates <- c("/new Date(1417621083)", "/Date(1417621204)", "/Date(1417621384)", 
           "/Date(1417621564)", "/Date(1417621623)")

当我通过RJSONIOdates解析器运行第二个任意向量时,一切似乎都很顺利。

library(RJSONIO)
make <- toJSON(list(date = dates, value = LETTERS))

然后,当我使用带有日期的 R-json C 例程的选项解析新的 JSON 文本时stringFun,结果是一个双元素列表,第一个元素是列表,第二个元素是原子向量。

(read <- fromJSON(make, stringFun = "R_json_dateStringOp"))
# $date
# $date[[1]]
# [1] "2014-12-03 07:38:03 PST"
# 
# $date[[2]]
# [1] "2014-12-03 07:40:04 PST"
# 
# $date[[3]]
# [1] "2014-12-03 07:43:04 PST"
# 
# $date[[4]]
# [1] "2014-12-03 07:46:04 PST"
# 
# $date[[5]]
# [1] "2014-12-03 07:47:03 PST"
# 
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

但我期待一个包含两个向量的列表,我宁愿以

# $date
# [1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST"
# [3] "2014-12-03 07:43:04 PST" "2014-12-03 07:46:04 PST"
# [5] "2014-12-03 07:47:03 PST"
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q"
# [18] "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

我尝试了几种方法来简化对 的调用中的结果fromJSON(),但都没有奏效。以下是我的一些尝试:

使用处理程序:这简化了结果,但无法重新格式化日期

h1 <- basicJSONHandler(simplify = TRUE)
fromJSON(make, handler = h1, stringFun = "R_json_dateStringOp")
# $date
# [1] "/new Date(1417621083)" "/Date(1417621204)"    
# [3] "/Date(1417621384)"     "/Date(1417621564)"    
# [5] "/Date(1417621623)"    
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

尝试 simplify 论点:我尝试了几种不同的方法,但都没有奏效。

fromJSON(make, simplify = StrictCharacter)
# $date
# [1] "/new Date(1417621083)" "/Date(1417621204)"    
# [3] "/Date(1417621384)"     "/Date(1417621564)"    
# [5] "/Date(1417621623)"    
#
# $value
#  [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

有没有办法简化调用日期的结果fromJSON()

4

3 回答 3

5

我认为您不能同时将日期强制转换为向量。原因很简单,这(尚未)在RJSONIO. 实际上,正如您提到的那样,简化是使用标志 : 完成的,StrictLogical它创建逻辑、数字或字符向量。也许您应该联系维护人员以添加日期标志。StrictNumericStrictCharacterStrictPosixctPOSIXct

使用stringFun无济于事,因为它接收一个标量元素(一个字符串)并且它不知道其他向量元素。您可以通过将 R 函数定义为 stringFun 参数并在其中放置浏览器来检查这一点。

convertJSONDate <-
  function(x)
  {
     if(grepl('Date',x)){
       val <- sub('.*[(]([0-9]+).*','\\1',x)
       return(structure(as.numeric(val)/1000, class = c("POSIXct", "POSIXt")))
     }
     x
   }

我想您出于性能原因在解析 json 时想要进行强制/简化。我会使用不同的策略:

  1. 我将我的数值强制转换为 POSIXct,并将它们作为字符存储在格式良好的日期中。这比特殊的(丑陋的)“new Date(.. ,date”) RJSONIO 日期格式要好。请记住,json 格式是一种标准格式,可以被其他语言(python、js、..)解析
  2. 然后将我的日期解析为普通字符,并使用快速fasttime包将其强制转换为 POSIXct 向量。

这里有一些代码来显示这一点:

## coerce x to dates a well formatted dates
dd <- as.character(as.POSIXct(x,origin = '1970-01-01' , tz = "UTC"))
## read it again in a fast way
fastPOSIXct(fromJSON(make)$date)

[1] "2014-12-03 16:38:03 CET" "2014-12-03 16:40:04 CET" "2014-12-03 16:43:04 CET" "2014-12-03 16:46:04 CET" "2014-12-03 16:47:03 CET"
于 2014-12-16T09:15:04.117 回答
3

read我猜测的值是所需的起点......这是一种方法:

> dd <- sapply(read, c) 
> class(dd) <- "POSIXct"
> dd
[1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST" "2014-12-03 07:43:04 PST"
[4] "2014-12-03 07:46:04 PST" "2014-12-03 07:47:03 PST"

类强制有点“肮脏”,但我已经尝试了很多其他(失败的)策略,例如unlist, sapply( read,"[[",1), sapply(read, c)) 来保留属性,所以我决定用 R 陷入泥潭并挥动类锤。

于 2014-12-05T01:56:18.547 回答
0

由于赏金已经过期,而且事实证明这目前无法完成RJSONIO(或者看起来如此),我将把它作为另一种替代方法,以防任何其他用户遇到这个问题并需要解决方案。

jsonlite可以很容易地完成这个操作。我们所要做的就是将POSIXt类添加到数字向量中,并"mongo"在非导出函数中指定解析器asJSON

# unloadNamespace(RJSONIO)  ## to avoid confusion between packages
library(jsonlite)    

x <- c(1417621083, 1417621204, 1417621384, 1417621564, 1417621623)

class(x) <- "POSIXt"    

data <- list(dates = x, values = letters[1:5])

json <- jsonlite:::asJSON(data, POSIXt = "mongo")

fromJSON(json)
# $dates
# [1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST"
# [3] "2014-12-03 07:43:04 PST" "2014-12-03 07:46:04 PST"
# [5] "2014-12-03 07:47:03 PST"
# 
# $values
# [1] "a" "b" "c" "d" "e"
于 2014-12-07T01:59:29.203 回答