我想通过 DIH 从 mysql 表中建立索引。一列是称为“标签”的整数类型,在 mysql 中用作按位处理查询。
select * from mytable where (tags & 1) > 0
因此,我打算将“标签”转换为数据导入处理程序中的多个值,以便我可以使用 BooleanQuery 以获得更好的性能。
一种解决方案可能会创建自定义的 DIH 模板,您能给我一些建议吗?
谢谢。
不确定我是否有您的用例,但是您可以使用标签字段并使用ScriptTransformer将其转换为多值字段
例子 -
数据配置 - 添加自定义字段 -
<script><![CDATA[
function addfield(row){
var fieldName = row.get('tags');
// Remove tags and Split/Convert tags as Array for Multivalued field
row.put(fieldName, tagsarray);
return row;
}
]]></script>