我正在尝试处理一个 json 文件以用于另一个将使用 excel 文件的程序。我的 json 文件有多个部分/数组,一个用于一些基本信息,如记录数、报告名称。它有用于列名的部分/数组,然后是另一个将每个单独的行/记录作为数组的部分/数组。
我尝试使用 pandas.read_json 和 json_loads 选项来读取数据,但我不断收到错误。如果我删除除一个(如行)部分之外的所有部分,我可以让它读取它(尽管它将所有列放在一列中,就像它没有将用逗号分隔的每个列名标识为单独的列一样。
理想情况下,我不想手动编辑此文件,只需在 python 中将其处理为 pandas 数据框,以便我可以进一步操作它并将其导出以供其他用途。
任何帮助将不胜感激。这是我的第一篇文章,所以如果有什么我可以做的更好,请告诉我!
这是 json 数据的表示,实际数据有更多的列和更多的行/记录(通常为 700+)
{
"count": 2,
"name": "report1",
"columnNames": [
"Incident ID",
"Status",
"Subject"
],
"rows": [
[
"2460636",
"Resolved",
"login help"
],
[
"2460637",
"Unresolved",
"email help"
]
]
}
我试图让 columnNames 部分成为熊猫数据框中的列名,并且每个“行”成为数据框中的一条记录。
我已经尝试查看其他示例,但我没有遇到像这样格式化的 json 的类似问题。
我尝试使用 pandas.read_json("example.json") 以及 json.loads 来加载数据以获取数据,但它们都出现了我似乎无法解决的不同错误。
运行 pandas.read_json("example.json") 时,它会返回说“数组必须都是相同的长度”。
结果应该是 columnNames 部分/数组应该是 pandas 数据框的列名,然后每个“行”我想成为数据框中的记录。