0

这里有人知道如何在谷歌数据准备中导入 json 文件吗?我可以在那里上传一个 json 文件,但它不能创建列。

这是屏幕截图:在此处输入图像描述

如您所见,它将所有 json 显示为 1 列。

我做了一些研究,并认为应该通过额外的步骤来支持 JSON

这是文章: https ://cloud.google.com/dataprep/docs/html/Supported-File-Formats_57344528

这是附加步骤文章: https ://cloud.google.com/dataprep/docs/html/Splitrows-Transform_57344654 。

我确实尝试过拆分行,但它仍然无法正常工作。我必须使用任何特定格式的 JSON 吗?

如果您能给我一个按预期工作的简单 json 文件示例,那就太好了。

谢谢。

4

2 回答 2

1

我正在测试数据准备,我使用了一个非常简单的 json 文件。但是 dataprep 只是导入是作为一个字符串。阅读文档时说“注意:Cloud Dataprep 要求 JSON 文件每行提交一个有效的 JSON 对象。”

这是没有意义的。为了使用工具进行数据准备,您必须首先使用另一个工具来准备数据。

https://cloud.google.com/dataprep/docs/html/Initial-Parsing-Steps_57344625

于 2018-04-12T11:03:09.593 回答
0

找到了答案。

示例数据:

{"name":"jonSnow","age":21,"dob":"1988-01-01","tags":["a","b"],"address":{"postcode":3122,"state":"vic"}}
{"name":"aom","age":21,"dob":"1988-02-01","tags":["c","d"],"address":{"postcode":3000,"state":"Vic"}}

当它被添加为数据集时,这些是步骤:(默认情况下,这已由 dataprep 建议)

  1. 拆分行。

    splitrows col: column1 on: '\n' 引用: '\"' quoteEscapeChar: '\"'

  2. 使用 un 创建列

    unnest col:column1键:'name','age','dob','tags','address.postcode','address.state'

据我了解,谷歌数据准备将接收您的 json 作为字符串。所以这真的取决于你如何导入数据集。

于 2017-09-27T05:24:22.497 回答