0

我正在建立一个过去发生的某些事件的数据库,并且需要在互联网上搜索许多术语以检索尽可能多的页面,其中包含与我想要记录的事件相关的术语。

首先,在阅读了以下问题后,我研究了使用 Google 的“自定义搜索 API”来实现这一点: 需要通过 R 访问 Google 自定义搜索 API 我确实设法通过浏览器获取搜索结果的 JSON,但不是通过 R,所以我移动了上。

当我看到自定义搜索 API 正在使用 OpenSearch,并找到 R 的 rOpenSearch 包时,我想尝试走这条路: http ://terradue.github.io/rOpenSearch/

通读文档后,仅提供了提供 opensearch 描述的搜索站点示例。由于我需要搜索尽可能多的网站,因此我似乎需要针对 Google 等搜索引擎的 opensearch 描述。但我似乎无法在任何地方找到它。

有什么方法可以通过互联网搜索。R 使用 OpenSearch,并在数据表中收集结果?

如果您知道我的问题的更好解决方案,如果您能指出我的另一个方向,我将不胜感激。

4

1 回答 1

0

如果我没看错,你正在寻找一种叫做Web Scraping via R的东西。

<见我!>

于 2019-08-05T03:19:15.567 回答