0

我有一个 json 行形式的示例提取,其中包含单个对象和大约 100 行。每行大约有 800 个项目。

以下是数据示例:

Row 1 - {"Id":"User1","OwnerId":"OwnerID1","IsDeleted":false,"Name":"SampleName1", etc...}

Row 2 - {"Id":"User2","OwnerId":"OwnerID2","IsDeleted":true,"Name":"SampleName2", etc...}

我想把它变成一个看起来像这样的数据框:

Id     | OwnerId     |  IsDeleted | Name         |  etc..
User1  | OwnerID1    |  false     | SampleName1  |  etc..
User2  | OwnerID2    |  true      | SampleName2  |  etc..

我对 dplyr 和 tidyr 做了一些试验,但没有成功。

有什么建议是处理这个问题的最佳方法吗?

我能够通过首先通过 JSON 验证器解析数据来修复数据格式来解决此问题。一旦我将数据转换为“正确”的 JSON 格式,就可以直接在 R 中将其作为数据框使用。

我按照其他用户的建议使用了 jsonLite,一切顺利。

install.packages("jsonlite")
library(jsonlite)
KafkaDF <- fromJSON("Kafka_Formatted_Full.JSON")

由于数据结构的原因,需要转换为矩阵。

KafkaDFM = as.matrix(KafkaDF)

然后进行另一个转换,以便可以将其导出到具有正确列和行对齐的 csv。

KDF2 <- apply(KafkaDFM, 2, as.character)
write.csv(KDF2,"C:\\Data\\KafkaCompleteClean.csv", row.names = TRUE)

4

0 回答 0