有没有办法以编程方式访问 Google 结果右侧的数据?
周围有类似的服务吗?专门用于位置数据
访问 = 无 html 抓取
这是一个例子:
有没有办法以编程方式访问 Google 结果右侧的数据?
周围有类似的服务吗?专门用于位置数据
访问 = 无 html 抓取
这是一个例子:
当人们在 Google 上搜索商家时,他们可能会在搜索结果右侧显示的框中看到有关该商家的信息。框中的信息称为知识面板,可以帮助客户发现和联系您的业务。
知识面板由知识图中的信息提供支持。
您问题中的示例来自Google 的 Knowledge Graph。
The Short Life of the Open Knowledge Graph很好地解释了为什么 Google 的 Knowledge Graph 数据不公开,以及项目为什么要关闭。
[谷歌产品管理总监杰克门泽尔]解释说,谷歌不能“参与”开放知识图项目有几个具体原因。首先,谷歌知识图谱中的一些数据来自封闭的数据集,这些数据集是从没有授予谷歌重新分发它们的权利的来源获得的。其他一些数据集具有更开放的许可证,但仍具有类似共享或归属限制。其次,他提醒说——原则上——谷歌阻止了任何允许收集关于其搜索和排名技术信息的自动提取,因为“它们是谷歌提供的专有核心”。
我试图按照您对位置数据的偏好顺序列出。
Freebase - http://www.freebase.com/将为您提供与您的 Google 搜索示例相同类型的信息并允许您获得相同类型的结果。
Freebase是一个开放的、知识共享许可的存储库, 包含近 2300 万个实体的结构化数据。
实体是单个人、地点或事物。Freebase 将实体连接在一起作为一个 图。
Wikidata - http://www.wikidata.org/wiki/Wikidata:Main_Page - Wikidata 是一个开源项目,数据可以自由访问
您可以为此使用谷歌知识图 API
创建身份验证凭据
knowlegdegraph<-function(query)
{
API_Key<-"YOUR_API_KEY"
url<-paste("https://kgsearch.googleapis.com/v1/entities:search?query=",query,
"&key=", API_Key,
"&limit=1&indent=True")
jdata <- fromJSON(URLencode(url))
}
Jdata 是一个列表。您可以从中提取用于定位的 JSON 元素
如果您有预算,您可以考虑serpapi.com,这是一个 Google 搜索 API 提供商,它执行实时 Google 搜索并以 JSON 形式返回结果。
通过 API 对关键字“咖啡”的示例搜索将返回完整的 SERP 参数和搜索结果的元数据。示例搜索的部分“知识面板”元数据返回如下:
"knowledge_graph": {
"title": "Coffee",
"image": "data:image/gif;base64,R0lGODlhAQABAIAAAP///////yH5BAEKAAEALAAAAAABAAEAAAICTAEAOw==",
"description": "Coffee is a brewed drink prepared from roasted coffee beans, the seeds of berries from certain Coffea species. The genus Coffea is native to tropical Africa and Madagascar, the Comoros, Mauritius, and Réunion in the Indian Ocean.",
"source": {
"name": "Wikipedia",
"link": "https://en.wikipedia.org/wiki/Coffee"
},
"countries_of_origin": "Yemen (drink), Ethiopia (plant)",
"coffee_companies": [
{
"name": "Starbucks",
"link": "https://www.google.com/search?hl=en&gl=us&q=Starbucks&stick=H4sIAAAAAAAAAONgFuLUz9U3MCorTMtVAjMNLZLji7REspOt9JPzc3Pz86xS8svzyhOLUopXMQoDxXJyUpNLMvPz9DOLi0tTi4oXsXIGlyQWJZUmZxcDANn7PURQAAAA&sa=X&ved=2ahUKEwjPi5uzxvDhAhXHu54KHXouArgQxA0wJnoECBIQBQ",
"source": "common"....