对于 synonymfilterfactory,我使用以下配置:
<filter
class="solr.SynonymFilterFactory"
synonyms="synonyms.txt"
ignoreCase="true"
expand="true"
tokenizer="solr.KeywordTokenizerFactory"
/>
但是当我索引内容时,令牌没有使用关键字tokenizerfactory 进行标记
位置-1-2-3-4-5
术语 text-i-am-a-cardiologist-specialist
---------------------------------心脏
标记“心脏”在与心脏病专家相同的位置进行标记,并创建了一个名为“专家”的单独标记。
在我的 synonyms.txt 中,我提到过:
心脏病专家,心脏专家
我不希望将同义词“心脏专家”分成两个标记(这就是为什么我在同义词配置中提到了关键字tokenizerfactory。有没有办法将多词同义词保留为单个标记?