0

我正在尝试使用 python 来纠正大型语料库的拼写(大约 100000 个短语):

买了一块大地毯后,我期待一个大包装,并对其非常小的尺寸感到惊讶我想验证内容是否与我的订单一致并且司机不允许它,但还是推荐在订单中?

降低环境音乐的声音......当我们进入这种类型的商店装饰时,我们是为了这句话来的,我们不想找到装饰的超市氛围。有库存的产品,我们可以离开。

店内员工的球童满载而归,在店内随处可见,无人看管,产生人流和整体视野 以论坛店铺为例

包重,单身女性不方便穿:我把车停在店门口,问有没有人可以帮我回答:不行,万一出事我们无权离开店!! !.

嵌入搜索而不是参考网站或在标签上注明产品名称 汽车 我需要知道产品的尺寸,但在网站上找到的时间很长,因为参考不允许我找到我买的物品前段时间有一个损坏的产品(对一幅画不好),但自从我想要它的那一刻起......我问它是否是最后一个副本,因为买一个产品很简单,我被派去螺栓部队!

...

脚本:

import enchant
from enchant.checker import SpellChecker

language = SpellChecker('en_US') # ou simplement 'en'
language.set_text(text)
for error in language:
    correction = error.suggest()[0]
    error.replace("%s" %(correction))
correcteur = language.get_text()
print (correcteur)

该程序可以运行,但会因错误而停止:

回溯(最近一次通话最后):

文件“correction.py”,第 4 行,更正 = error.suggest()[0] IndexError: list index out of range

4

1 回答 1

2

只需检查建议至少有一项:如果没有建议的更正,您可能会遇到错误:

for error in language:
    if len(error.suggest())>0: 
        correction = error.suggest()[0]
        error.replace("%s" %(correction))
于 2018-06-29T15:41:43.900 回答