2

我正在将数据从 mysql 中提取到 solr 中。其中一个字段是使用 group_concat 函数生成的,该函数会生成一个逗号分隔的字段,其中列出了事件的所有波段。当时我认为这是为一个活动存储多个乐队的最佳方式。但是,我发现我无法针对所有事件处理此查询。

我已将波段字段设置为字符串并将多值设置为 true。

<field name="bands" type="string" indexed="true" stored="true" multiValued="true"/>

结果与预期的一样,字符串被刻面为一个长字符串。

“珍珠酱,爱丽丝,尖叫的树,Everclear”,1,“Primus,Gaga,培根块”,1,“公鸡,翅膀,鼓槌,尾羽”,1,

这种方法的最大问题是当字段类型是字符串时,它似乎不可搜索。似乎我需要创建一个重复字段,该字段类型为 text_general 用于搜索,并有一个用于分面。是的?

有没有办法为带字段声明一个分隔符以正确处理这个问题,或者我的方法是错误的?

4

1 回答 1

9

标记您的领域并不能解决您的方面问题,您将能够使用单个乐队名称进行搜索并获得结果,但方面会更糟。基本规则是不要对用于制作构面的字段使用任何标记化或文本增强。

最好使用 multiValued 字段,但实际上是在其中放入一个带有波段列表的单个值,因为您的查询将该列表作为单个列返回,该列映射到 Solr 中相关字段的单个值。

您可以保留group_concat输出并通过对 的简单更改来解决您的问题data-config.xml,告诉 Solr 使用分隔符拆分这些波段名称。看一下RegexTransformer及其splitBy参数:

splitBy:用于拆分一个String获取多个值,返回一个值列表

如果您splitBy使用相同的分隔符来配置group_concat该技巧,那么您将拥有多个值,并且您的构面看起来会很好。

于 2012-03-28T20:21:28.843 回答