0

我正在做一个项目,我需要从 Google Scholar 中提取一些数据。我的 PHP 程序从我的本地机器获取一个字符串,将其传递给 Google Scholar,然后在搜索结果页面上取出第一个结果并将其保存到数据库中。

我必须为近 90,000 个字符串/查询执行此操作。问题是,在数百次输入后,程序停止,因为 Google Scholar 要求进行验证码验证。我能做些什么呢?

4

1 回答 1

1

因为 Google Scholar 没有 API,所以没有文档化的方式来做你想做的事。您不应该像这样抓取数据,这就是您遇到 Google 机器人保护功能的原因。我认为您唯一真正的选择是等待 Google 创建 API。

于 2011-05-30T21:05:08.643 回答