给定句子:“the quick brown fox jumped over the lazy dog”,我想得到一个 nltk 语料库中每个单词的频率得分(哪个语料库是最通用/最全面的)
编辑:
这个问题与这个问题有关:python nltk keyword extract from sentence where @adi92 建议使用 idf 的技术来计算单词的“稀有度”。我想看看这在实践中会是什么样子。这里更广泛的问题是,你如何计算一个单词在英语中的稀有度。我很欣赏这是一个很难解决的问题,但是 nltk idf (使用诸如 brown 或 reuters 语料库之类的东西??)可能会让我们成为其中的一部分?