我正在尝试使用 Glue 复制一些生产数据库(RDS mySQL 到 Redshift)。我已经取得了一些成功,但是当涉及到包含 JSON 列的数据库时,我正在苦苦挣扎。理想情况下,我会将 JSON 数组拆分为多个列以方便分析。有没有一种简单的方法可以用 Glue 做到这一点?
如果这看起来很容易,请提前道歉,但我对该工具的了解有限。
我正在尝试使用 Glue 复制一些生产数据库(RDS mySQL 到 Redshift)。我已经取得了一些成功,但是当涉及到包含 JSON 列的数据库时,我正在苦苦挣扎。理想情况下,我会将 JSON 数组拆分为多个列以方便分析。有没有一种简单的方法可以用 Glue 做到这一点?
如果这看起来很容易,请提前道歉,但我对该工具的了解有限。
您是否检查过将 Relationalize.apply() 与 AWS Glue API 一起使用?
AWS 中提供了一个示例: https ://aws.amazon.com/blogs/big-data/simplify-querying-nested-json-with-the-aws-glue-relationalize-transform/
问候,