我正在尝试根据英语词典检查标签列表。我正在使用 pyenchant,但我不断收到错误消息。读取“?”后似乎有错误。我尝试使用字符串库和以下代码删除所有标点符号:
for punc in string.punctuation:
title = title.replace(punc,'')
但是有些这个字符看起来像一个?正在扔掉字典。
代码片段:
if word not in stopwords.words('english'):
print word, "=", d.check(word)
if d.check(word):
tags.append(word.lower())
回复:
Learning = True
Lens = True
Children = True
Pumkincom = False
Pumkin = False
** (process:49042): CRITICAL **: enchant_dict_check: assertion `g_utf8_validate(word, len, NULL)' failed
? =
我正在使用 Python 2.7.3 和 pyenchant-1.6.5-py2.7
编辑:我想我通过检查是否 len(word)==1 解决了这个问题,但我想知道为什么会发生这种情况。