问题标签 [json-normalize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
27 回答
704195 浏览

python - 如何将 JSON 转换为 CSV?

我有一个要转换为 CSV 文件的 JSON 文件。我怎样才能用 Python 做到这一点?

我试过了:

但是,它没有用。我正在使用 Django,我收到的错误是:

然后我尝试了以下方法:

然后我得到错误:

示例 json 文件:

0 投票
1 回答
1855 浏览

python - 如何使用 python 展平 JSON 数组

我正在处理一个 JSON 结构,其输出如下:

如您所见,这些是嵌套数组。关于递归地展平这些有很多讨论。我无法在HotelSummary. 有任何想法吗?

  • 我想将部分 JSON 展平为以下形式:
  • 我试过使用flattenDict类。我没有得到所需格式的输出。
0 投票
1 回答
472 浏览

python - 如何规范化嵌套字典和列表的列表

我有以下输出 json,我尝试使用 pandas 将其转换为数据框json_normalize。我能够达到跑步者的水平json_normalize(data, ['runners']),但我要达到前水平。

使用其他数据,我很容易做到这一点json_normalize(data, ['runners','ex']),但如果我在这种情况下这样做,我会得到

它应该有列'availableToBack', 'availableToLay','tradedVolume'

0 投票
13 回答
186643 浏览

python - 使用 pandas 将一列字典拆分/分解为单独的列

我将数据保存在postgreSQL数据库中。我正在使用 Python2.7 查询这些数据并将其转换为 Pandas DataFrame。但是,这个数据框的最后一列里面有一个值字典。DataFramedf如下所示:

我需要将此列拆分为单独的列,以便 DataFrame `df2 看起来像这样:

我遇到的主要问题是列表的长度不同。但所有列表最多只包含相同的 3 个值: 'a'、'b' 和 'c'。它们总是以相同的顺序出现('a' 首先,'b' 第二,'c' 第三)。

以下代码用于工作并准确返回我想要的(df2)。

我上周才运行这段代码,它运行良好。但是现在我的代码被破坏了,我从第 [4] 行得到了这个错误:

我没有对代码进行任何更改,但现在出现错误。我觉得这是因为我的方法不够稳健或不恰当。

任何有关如何将此列列表拆分为单独列的建议或指导都将非常感激!

编辑:我认为.tolist()and .apply 方法不适用于我的代码,因为它是一个 Unicode 字符串,即:

postgreSQL数据以这种格式从数据库中导入。关于这个问题的任何帮助或想法?有没有办法转换Unicode?

0 投票
1 回答
3946 浏览

python - pandas json_normalize KeyError

我有一个没有统一结构的嵌套 json 文件,如以下示例:

看到在第二项中,第一项中不存在列表名称“kids”。

当我尝试使用 pandas json_normalize 将 json 展平时,它会抛出错误消息:“KeyError:'kids'”

这是 json_normalize 命令:

似乎 json_normalize 不支持没有统一结构的嵌套 json。

有人遇到过同样的问题吗?你知道如何通过它吗?

0 投票
1 回答
507 浏览

python - 大熊猫中的 json_normalize()

Python版本:2.7

我正在尝试规范化以下 MongoDB 中可用的 json 数据。为此,我正在使用 json_normalize。但是我无法展平“阶段”元素中的数据。它正在收藏中。当我连续处理这个“阶段”时,它工作正常。如何将阶段内的内容与其余数据一起展平?样本数据如下。

我试过的代码如下。

预期输出如下。

0 投票
2 回答
1153 浏览

arrays - 将 JSON 文本字符串转换为 Pandas,但每个行单元格最终都作为内部值数组

我设法从门户网站中提取时间序列的价格。数据以 json 格式到达,我将它们转换为 pandas 数据帧。

不幸的是,不同波段的数据来自一个文本字符串,我似乎无法正确提取它们。

下面是我提取的json数据

在此处输入图像描述

我使用此代码将它们转换为熊猫数据框

让他们像这样

在此处输入图像描述

我需要提取(例如)ClosePrice 列中的数据,以便对它们进行数据分析和清理。

我尝试使用

但它并没有真正起作用。

有没有办法a)当我将json转换为dataFrame时,以便在各个列中提取closePrice,bidPrice等中的价格或b)如果它们保存在dataFrame中,提取其中的文本字符串,例如我可以提取文本字符串中的价格(例如买价、卖价和lastTraded)吗?

0 投票
2 回答
31914 浏览

python - 在熊猫数据框中展平嵌套的 Json

我正在尝试将 json 文件加载到 pandas 数据框。我发现有一些嵌套的json。以下是示例 json:

我使用以下代码将 json 加载到数据框中:

下面是 df.head() 的输出

df的输出

这是输出

但是我发现了两个嵌套列,例如位置和标签。

我尝试使用以下代码将其展平:

它向我显示了如下错误:

你能告诉我如何展平位置和标签(那些有嵌套数据的)。

谢谢,泽普

0 投票
3 回答
1893 浏览

python - 如何将字典的文本文件读入 DataFrame

我有一个来自皇室战争统计数据的 Kaggle 文本文件。它采用 Python 字典的格式。我正在努力找出如何以有意义的方式将其读入文件。好奇最好的方法是做到这一点。这是一个相当复杂的带有列表的字典。

此处的原始数据集: https ://www.kaggle.com/s1m0n38/clash-royale-matches-dataset

0 投票
3 回答
902 浏览

python - 如何将多个 json 部分(全部在一个文件中)导入 python/pandas

我正在尝试处理一个 json 文件以用于另一个将使用 excel 文件的程序。我的 json 文件有多个部分/数组,一个用于一些基本信息,如记录数、报告名称。它有用于列名的部分/数组,然后是另一个将每个单独的行/记录作为数组的部分/数组。

我尝试使用 pandas.read_json 和 json_loads 选项来读取数据,但我不断收到错误。如果我删除除一个(如行)部分之外的所有部分,我可以让它读取它(尽管它将所有列放在一列中,就像它没有将用逗号分隔的每个列名标识为单独的列一样。

理想情况下,我不想手动编辑此文件,只需在 python 中将其处理为 pandas 数据框,以便我可以进一步操作它并将其导出以供其他用途。

任何帮助将不胜感激。这是我的第一篇文章,所以如果有什么我可以做的更好,请告诉我!

这是 json 数据的表示,实际数据有更多的列和更多的行/记录(通常为 700+)

我试图让 columnNames 部分成为熊猫数据框中的列名,并且每个“行”成为数据框中的一条记录。

我已经尝试查看其他示例,但我没有遇到像这样格式化的 json 的类似问题。

我尝试使用 pandas.read_json("example.json") 以及 json.loads 来加载数据以获取数据,但它们都出现了我似乎无法解决的不同错误。

运行 pandas.read_json("example.json") 时,它会返回说“数组必须都是相同的长度”。

结果应该是 columnNames 部分/数组应该是 pandas 数据框的列名,然后每个“行”我想成为数据框中的记录。