0

我正在尝试对大量推文进行一些单词分析。

我正在根据搜索查询拉推文,然后我想以某种方式找到经常出现且与原始查询相关的关键字。

不过,我不太确定如何以合理有效的方式解决这个问题。我目前只是删除停用词然后找到最常出现的词,但这比我想要的更基本。

有没有人对这类事情有任何建议(甚至链接到任何关于该主题的阅读)?

非常感谢任何帮助。

(我的实现是在 Python 中,如果相关的话)

4

1 回答 1

3

对于推文内容的语义推理,您绝对应该尝试使用 NLTK(自然语言工具包)。它能够对文本进行非常复杂的分析。

于 2013-02-15T15:28:06.580 回答