我正在尝试使用parse_stream()
rwteet 库中的函数函数解析大型 JSON 文件。它因长 JSON 对象而失败。
此 JSON 对象在具有相当大的大小 (200MB-1GB) 时往往会产生错误。我的流功能看起来像这样。
stream_tweets(
"#google,#apple",
timeout = 60*60*6, #six hours
file_name = json_filename,
dir= "./raw_tweets/"
)
djt <- parse_stream(json_filename)
我没有启用该parse = TRUE
参数,因为在文档中它说不建议在大型 JSON 对象中使用。无论如何,我也尝试过流式传输,但parse = TRUE
也失败了parse_stream()
。我得到的错误是以下错误:
Error: parse error: unallowed token at this point in JSON text
ELDkx4-i7ysCAR_.mp4?tag=10"},,{"bitrate":2176000,"content_ty
(right here) ------^
我以为是两个大括号之间的双逗号。我使用ctrl+f搜索了 Atom字符串ELDkx4-i7ysCAR_.mp4?tag=10"}
,唯一的结果是没有,,
.
为什么我得到这个解析错误,有人遇到同样的问题并以某种方式修复它吗?