我一直在网上搜索,发现 CNN 和 NPR 等媒体提供了访问其成绩单的链接。要获得它们需要编写一些不太方便的爬虫之类的东西。原因是我试图在我的自然语言处理项目中使用一些电视节目、采访、广播、电影的成绩单作为训练数据。所以我想知道网络上是否有任何免费的集合或数据库,以便我可以一次下载所有这些而无需自己编写爬虫?
问问题
1694 次
我一直在网上搜索,发现 CNN 和 NPR 等媒体提供了访问其成绩单的链接。要获得它们需要编写一些不太方便的爬虫之类的东西。原因是我试图在我的自然语言处理项目中使用一些电视节目、采访、广播、电影的成绩单作为训练数据。所以我想知道网络上是否有任何免费的集合或数据库,以便我可以一次下载所有这些而无需自己编写爬虫?