3

我正在尝试根据英语词典检查标签列表。我正在使用 pyenchant,但我不断收到错误消息。读取“?”后似乎有错误。我尝试使用字符串库和以下代码删除所有标点符号:

for punc in string.punctuation:
    title = title.replace(punc,'')

但是有些这个字符看起来像一个?正在扔掉字典。

代码片段:

if word not in stopwords.words('english'):
    print word, "=", d.check(word) 
    if d.check(word):       
        tags.append(word.lower())

回复:

Learning = True
Lens = True
Children = True
Pumkincom = False
Pumkin = False

** (process:49042): CRITICAL **: enchant_dict_check: assertion `g_utf8_validate(word, len, NULL)' failed
     ? =

我正在使用 Python 2.7.3 和 pyenchant-1.6.5-py2.7

编辑:我想我通过检查是否 len(word)==1 解决了这个问题,但我想知道为什么会发生这种情况。

4

1 回答 1

3

我之前遇到过这个问题,但这是由于文本中存在非英文字母我建议您确保该单词仅包含英文字母

于 2013-08-14T18:31:10.237 回答