2

我需要从 Kafka Topic 和 Sink 监听事件到 MongoDB 中的集合。该消息包含一个带有 id 属性的嵌套对象,如上例所示。

{
    "testId": 1,
    "foo": "bar",
    "foos": [{ "id":"aaaaqqqq-rrrrr" }]
}

我正在尝试使用 RegExp 将此嵌套 id 重命名为 _id

{
        "connector.class":"com.mongodb.kafka.connect.MongoSinkConnector",
        "topics": "test",
        "connection.uri": "mongodb://mongo:27017",
        "database": "test_db",
        "collection": "test",
        "key.converter": "org.apache.kafka.connect.storage.StringConverter",
        "value.converter": "org.apache.kafka.connect.json.JsonConverter",
        "value.converter.schemas.enable": "false",
        "document.id.strategy": "com.mongodb.kafka.connect.sink.processor.id.strategy.PartialValueStrategy",
        "value.projection.list":"testId",
        "value.projection.type": "whitelist",
        "post.processor.chain": "com.mongodb.kafka.connect.sink.processor.DocumentIdAdder, com.mongodb.kafka.connect.sink.processor.field.renaming.RenameByRegex",
        "field.renamer.regexp": "[{\"regexp\":\"\b(id)\b\", \"pattern\":\"\b(id)\b\",\"replace\":\"_id\"}]"
    }

配置/验证的结果是500 Internal Server Error,带有该消息:

{
    "error_code": 500,
    "message": null
}

我错过了什么或者是一个问题?

4

1 回答 1

1

我认为您想要的只是Kafka Connect 单消息转换 (SMT),更准确地说ReplaceField

过滤或重命名 Struct 或 Map 中的字段。


以下将用 替换id字段名称_id

"transforms": "RenameField",
"transforms.RenameField.type": "org.apache.kafka.connect.transforms.ReplaceField$Value",
"transforms.RenameField.renames": "id:_id"

在您的情况下,在应用上述转换之前,您可能还需要:Flatten foos

"transforms": "flatten",
"transforms.flatten.type": "org.apache.kafka.connect.transforms.Flatten$Value",
"transforms.flatten.delimiter": "."

最后应用转换来重命名字段:

"transforms": "RenameField",
"transforms.RenameField.type": "org.apache.kafka.connect.transforms.ReplaceField$Value",
"transforms.RenameField.renames": "foos.id:foos._id"
于 2020-04-13T16:35:26.217 回答