1

我正在用 python 写一个小新闻情绪分析应用程序。我想准备一个新闻文章数据库来训练我的分类器,所以我想知道从网络上获取新闻文章的最佳做法是什么。我查看了报纸,它看起来像一个很酷的模块并且非常通用,但我正在寻找一种获取旧新闻文章的方法 - 即 2014 年的所有新闻文章。报纸只使用永远不会太远的 RSS 提要。另一种选择是为谷歌新闻编写一个抓取工具,并在 url 中按日期过滤,或者使用 NYT 等出版商的 API(他们有一个 API)。

创建这样的新闻文章数据库的最佳方法是什么?网络上是否有可用于获取文章的工具/数据库?

4

0 回答 0