我有一个 json 行形式的示例提取,其中包含单个对象和大约 100 行。每行大约有 800 个项目。
以下是数据示例:
Row 1 - {"Id":"User1","OwnerId":"OwnerID1","IsDeleted":false,"Name":"SampleName1", etc...}
Row 2 - {"Id":"User2","OwnerId":"OwnerID2","IsDeleted":true,"Name":"SampleName2", etc...}
我想把它变成一个看起来像这样的数据框:
Id | OwnerId | IsDeleted | Name | etc..
User1 | OwnerID1 | false | SampleName1 | etc..
User2 | OwnerID2 | true | SampleName2 | etc..
我对 dplyr 和 tidyr 做了一些试验,但没有成功。
有什么建议是处理这个问题的最佳方法吗?
我能够通过首先通过 JSON 验证器解析数据来修复数据格式来解决此问题。一旦我将数据转换为“正确”的 JSON 格式,就可以直接在 R 中将其作为数据框使用。
我按照其他用户的建议使用了 jsonLite,一切顺利。
install.packages("jsonlite")
library(jsonlite)
KafkaDF <- fromJSON("Kafka_Formatted_Full.JSON")
由于数据结构的原因,需要转换为矩阵。
KafkaDFM = as.matrix(KafkaDF)
然后进行另一个转换,以便可以将其导出到具有正确列和行对齐的 csv。
KDF2 <- apply(KafkaDFM, 2, as.character)
write.csv(KDF2,"C:\\Data\\KafkaCompleteClean.csv", row.names = TRUE)