我有 2 个用于乌克兰语的 hunspell 格式(.dic 和 .aff)的文件。我的程序必须获得输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。即使使用 Hunspell util,我也不知道如何实现这一点,但假设它是可能的。
哪些 python 库可以使用 .dic 和 .aff 文件获取单词的基本形式?
我有 2 个用于乌克兰语的 hunspell 格式(.dic 和 .aff)的文件。我的程序必须获得输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。即使使用 Hunspell util,我也不知道如何实现这一点,但假设它是可能的。
哪些 python 库可以使用 .dic 和 .aff 文件获取单词的基本形式?
如前所述,hunspell 是您需要的库。来自https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell的示例:
import hunspell
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff')
hobj.spell('spookie')
>>>>False
hobj.suggest('spookie')
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill']
hobj.spell('spooky')
>>>>True
hobj.analyze('linked')
>>>>[' st:link fl:D']
hobj.stem('linked')
>>>>['link']
只是更新说 le pyhunspell 项目不再在 googlecode 上。以下是新链接:
至于添加功能(在第一个答案的评论中提到),它现在记录在 pydoc 中。