1

使用 PyEnchant 时是否可以从字典中排除某些单词?例如,我想检查一个单词是英语('en_EN'在我的情况下)还是法语('fr_FR')。"de但是,当我针对两个字典检查字符串" 时,都返回 true。

4

1 回答 1

0

您可以尝试在传递给 Pyenchant 之前删除停用词

from nltk.corpus import stopwords

    def remove_stop_words(self, tokenized_docs_no_punctuation):
        """

        :param tokenized_docs_no_punctuation:
        :return:
        """
        # print 'CleanupText.remove_stop_words()'
        tokenized_docs_no_stopwords = []
        for token in tokenized_docs_no_punctuation:
            if not token in stopwords.words('english'):
                tokenized_docs_no_stopwords.append(token)

        return tokenized_docs_no_stopwords

然后这些令牌将它们传递给 Pyenchant

于 2016-02-16T21:15:17.530 回答