4

您是否知道任何足够大的 lemmatizer 数据库可以为以下示例词返回正确结果:

geese: goose
plantes: //not found

Wordnet 的形态分析器是不够的,因为它给出了以下不正确的结果:

geese: //not found
plantes: plant
4

2 回答 2

2

MorphAdorner似乎在这方面做得更好,但它仍然发现“植物”的结果不正确

plantes: plante
geese: goose

也许您想使用 MorphAdorner 进行词形还原,然后对照 WordNet 检查其结果。您可以使用 WordNet API 执行查找,而无需先通过调用findtheinfo_ds. 这允许您首先使用像 MorphAdorner 这样的词形还原器。(如果你想使用 lemmaitzer,你需要morph单独调用并调用findtheinfo_ds它返回的 lemmas。)

另一方面,为此我只花了大约 5 秒钟查看 MorphAdorner,并且可能有一种方法可以消除不正确的“植物”答案,而无需使用任何其他外部资源。

于 2011-06-10T15:56:30.057 回答
1

曾几何时,有人向我推荐了 Morpha,但我没有使用过,所以我不知道它在这方面是否比 WordNet 做得更好。

于 2011-06-10T16:01:20.333 回答