我正在使用 Lucene 7.x 和 ItalianStemmer。我看过 ItalianStemmer 类的代码,似乎需要很长时间才能理解。因此,我正在寻找一种快速(可能是标准)的方式来定制意大利词干分析器,而不需要扩展 ItalianStemmer 或 SnowballProgram,因为我只有几天时间。
关键是我不明白为什么“saluto”(问候)这个名字是“sal”。它的词干应该是“salut”,因为动词“salutare”(问候)的词干是“salut”。此外,“sala”(房间)和“sale”(房间)也被词根为“sal”,这很容易混淆,因为它们的含义不同。