使用 PyEnchant 时是否可以从字典中排除某些单词?例如,我想检查一个单词是英语('en_EN'
在我的情况下)还是法语('fr_FR'
)。"de
但是,当我针对两个字典检查字符串" 时,都返回 true。
问问题
323 次
1 回答
0
您可以尝试在传递给 Pyenchant 之前删除停用词
from nltk.corpus import stopwords
def remove_stop_words(self, tokenized_docs_no_punctuation):
"""
:param tokenized_docs_no_punctuation:
:return:
"""
# print 'CleanupText.remove_stop_words()'
tokenized_docs_no_stopwords = []
for token in tokenized_docs_no_punctuation:
if not token in stopwords.words('english'):
tokenized_docs_no_stopwords.append(token)
return tokenized_docs_no_stopwords
然后这些令牌将它们传递给 Pyenchant
于 2016-02-16T21:15:17.530 回答