我正在使用 Hunspell 为 SOLR 实例提取词干。在大多数情况下,它似乎运作良好。
我正在使用 OpenOffice dic/aff 文件。
但是,有一些值得注意的词例外,我希望能够将这些作为词干的候选者删除。
一个很好的例子是“skier”,它源于“sky”,原因如下:
in the .dic file
sky/MDRSGZ
relevant rule in the .aff file
SFX R y ier [^aeiou]y
有什么方法可以表明这一点,skier
并且只skier
应该不理会吗?