1

我有一个系统将数据导出为 XML 2003 工作表。我需要通过数据融合或使用 GCP 资源的任何其他进程将其加载到 Bigquery。所以

  • 是否可以使用 DataFusion 完成此操作
  • 我遵循了https://www.youtube.com/watch?v=e-5K4cxwGrc&feature=youtu.be中的 XML 转换过程。到目前为止,我已经达到了标题和数据行出现在不同行但同一列中的地步。我无法将它进一步解析(使用 Wrangler)到各个列,因为它只是不断隔离不同行但同一列中的 json 键:值对

由于我是数据融合的新手,请感谢一些详细的指导。

4

1 回答 1

0

这可以使用数据融合来实现。

基本上,一旦您拥有文件(直接上传或使用源连接)并使用 XML 到 JSON 的转换,您可以为 JSON 添加解析操作,以便将其解析为列 [1]。这将在牧马人中添加另一个转换。

此外,我建议您查看 GCP 中数据融合的文档,该文档非常不言自明 [2]。

[1]- 列转换 -> 解析 -> JSON

[2]- https://cloud.google.com/data-fusion/docs

于 2020-12-11T14:29:22.140 回答