您是否知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确结果:
geese: goose
plantes: //not found
Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:
geese: //not found
plantes: plant
您是否知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确结果:
geese: goose
plantes: //not found
Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:
geese: //not found
plantes: plant
MorphAdorner似乎在这方面做得更好,但它仍然发现“植物”的结果不正确
plantes: plante
geese: goose
也许您想使用 MorphAdorner 进行词形还原,然后对照 WordNet 检查其结果。您可以使用 WordNet API 执行查找,而无需先通过调用findtheinfo_ds
. 这允许您首先使用像 MorphAdorner 这样的词形还原器。(如果你想使用 lemmaitzer,你需要morph
单独调用并调用findtheinfo_ds
它返回的 lemmas。)
另一方面,为此我只花了大约 5 秒钟查看 MorphAdorner,并且可能有一种方法可以消除不正确的“植物”答案,而无需使用任何其他外部资源。