Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试对大量推文进行一些单词分析。
我正在根据搜索查询拉推文,然后我想以某种方式找到经常出现且与原始查询相关的关键字。
不过,我不太确定如何以合理有效的方式解决这个问题。我目前只是删除停用词然后找到最常出现的词,但这比我想要的更基本。
有没有人对这类事情有任何建议(甚至链接到任何关于该主题的阅读)?
非常感谢任何帮助。
(我的实现是在 Python 中,如果相关的话)
对于推文内容的语义推理,您绝对应该尝试使用 NLTK(自然语言工具包)。它能够对文本进行非常复杂的分析。