2

我有 2 个用于乌克兰语的 hunspell 格式(.dic 和 .aff)的文件。我的程序必须获得输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。即使使用 Hunspell util,我也不知道如何实现这一点,但假设它是可能的。

哪些 python 库可以使用 .dic 和 .aff 文件获取单词的基本形式?

4

2 回答 2

3

如前所述,hunspell 是您需要的库。来自https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell的示例:

import hunspell
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff')
hobj.spell('spookie')
>>>>False

hobj.suggest('spookie')
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill']

hobj.spell('spooky')
>>>>True

hobj.analyze('linked')
>>>>[' st:link fl:D']
hobj.stem('linked')
>>>>['link']
于 2014-09-06T18:51:08.820 回答
0

只是更新说 le pyhunspell 项目不再在 googlecode 上。以下是新链接:

至于添加功能(在第一个答案的评论中提到),它现在记录在 pydoc 中。

于 2015-11-30T08:35:42.477 回答