1

我正在尝试使用 pyenchant 对英语和保加利亚语文本进行拼写检查。我有一个问题,在英语中,单词在小写和以大写字母开头时都会被识别。例如:

>>> d = Dict('en_GB')
>>> d.check('car')
True
>>> d.check('Car')
True

但是,在保加利亚语中:

>>> d = Dict('bg_BG')
>>> d.check('кола')
True
>>> d.check('Кола')
False

这是正常行为吗?我想使用 SpellChecker 类来检查整个段落,这妨碍了我。我真的不想.lower()在整个 str 上使用,因为这似乎是一个 hack。我正在使用pyenchant==1.6.8Python 3.5.2。en_US 和 en_GB 字典随 pyenchant 一起提供,我https://cgit.freedesktop.org/libreoffice/dictionaries/plain/bg_BG/bg_BG.dic分别从 aff 和 aff 下载了 bg_BG 字典。我不得不将它们从 Windows-1251 转换为 UTF-8,否则无法识别任何单词。

4

0 回答 0