在从 Kafka 到 Druid 的摄取过程中,是否可以按维度值过滤数据?
例如考虑维度:version
,可能有值:,,v1
我只想加载。v2
v3
v2
我意识到可以使用 Spark/Flink/Kafka Streams 来完成,但也许有一个开箱即用的解决方案
在从 Kafka 到 Druid 的摄取过程中,是否可以按维度值过滤数据?
例如考虑维度:version
,可能有值:,,v1
我只想加载。v2
v3
v2
我意识到可以使用 Spark/Flink/Kafka Streams 来完成,但也许有一个开箱即用的解决方案
您可以transformSpec
在摄取期间执行此操作。
http://druid.io/docs/latest/ingestion/transform-spec.html
根据文档:
转换规范允许 Druid 在摄取期间过滤和转换输入数据。
任何查询过滤器都可以应用于此。
过滤器的示例用法NOT
:
"transformSpec": {
"filter": {
"type": "and",
"fields": [
{
"type": "not",
"field": {
"type": "selector",
"dimension": "my_dimension",
"value": "filter_me"
}
},
{
"type": "not",
"field": {
"type": "selector",
"dimension": "my_dimension",
"value": "filter_me_also"
}
}
]
},
"transforms": []
}
从德鲁伊方面不可能,您需要事先过滤数据。