2

我目前正试图通过尝试将我目前通过 Python 所做的事情移植到 Kettle 工作中来了解 Kettle 4.4 如何处理数据转换。

我有一个包含四个表的关系数据库,我需要将它们导入到我的数据管道中。这是模型的简化版本...

小部件

+-----------+-------------+----------------+
| WIDGET_ID |    Name     |     Notes      |
+-----------+-------------+----------------+
|         1 | Gizmo       | Red paint job  |
|         2 | Large Gizmo | Blue paint job |
+-----------+-------------+----------------+

顾客

+-----------+------------+----------------------------------+
| WIDGET_ID |    Name    |         Mailing_Address          |
+-----------+------------+----------------------------------+
|         1 | Acme, Inc. | 123 Fake Street, Springfield, IL |
|         2 | Fake Corp. | 555 Main Street, Small Town, IN  |
|         2 | Acme, Inc. | 123 Fake Street, Springfield, IL |
+-----------+------------+----------------------------------+

存货

+-----------+--------+------------+
| WIDGET_ID | Amount |    Date    |
+-----------+--------+------------+
|         2 |  11000 | 2012-01-15 |
|         1 |  13000 | 2012-02-05 |
|         1 |    900 | 2013-01-01 |
+-----------+--------+------------+

我希望能够采用上述方法并生成如下 JSON 输出:

{
    "id": 1,
    "Name": "Gizmo",
    "Notes": "Red Paint Job",
    "Customers": [
        {
            "Name": "Acme, Inc.",
            "Address": "123 Fake Street..."
        }
    ],
    "Inventory": [
        {
            "Amount": 13000,
            "Date": "2012-02-05"
        },
        {
            "Amount": 900,
            "Date": "2013-01-01"
        }
    ]
}

我尝试使用 Kettle 的连接、JS 转换和 JSON 输出都不是很成功,而且我发现文档非常缺乏。任何人都可以帮助我,或指出我正确的方向吗?

谢谢!

4

1 回答 1

3

您可以使用 3 个(总共 6 个)水壶步骤进行此转换:

1)为每个表添加 3 个表输入步骤。

2)接下来添加一个 Multiway Merge Join步骤,将3个表输入步骤箭头分组到此,选择widget_id作为关键字段,选择内部连接类型。

3)在多路连接步骤的输出流中添加 1 个json 输出步骤。

要制作最终的 json 格式,您必须使用 JSONPath 表示法:

http://goessner.net/articles/JsonPath/

希望能帮助到你。

(如果您是水壶新手,我建议您查看水壶勺中包含的样品文件夹)

于 2013-04-29T19:05:00.997 回答