我正在尝试在词干提取中添加自定义字典,但没有找到运气。
我试过的步骤:
1)我在中添加了以下几行/config/script/DataIngest.xml
:
<dgidx id="Dgidx" host-id="ITLHost">
<args>
.....
<arg>--stemming-updates</arg>
<arg>C:/Endeca/Apps/CRS/config/script/stemmingExtension.en.xml</arg>
</args>
</dgidx>
并在中添加了以下几行stemmingExtension.en.xml
:
<word_forms_collection_updates>
<WORD_FORMS>
<WORD_FORM>shuts</WORD_FORM>
<WORD_FORM>shirts</WORD_FORM>
</WORD_FORMS>
</word_forms_collection_updates>
运行基线更新,然后尝试搜索“shuts”并期望得到“shirts”结果,但没有。
在词干中设置自定义词典单词的正确方法是什么?
在此先感谢您的帮助。
巴萨瓦拉杰