1

我目前正在开发一个行为定位应用程序,我需要一个相当大的关键字数据库/工具/提供程序,使应用程序能够通过我的应用程序的给定关键字访问相似的关键字。我最近发现了 Freebase,它在 Google 收购它们之前就提供了类似的服务,然后集成到他们的知识图谱中。我想知道是否有可能为给定实体提供相关主题/关键字的列表。

import json
import urllib

api_key = 'API_KEY_HERE'
query = 'Yoga'
service_url = 'https://kgsearch.googleapis.com/v1/entities:search'
params = {
    'query': query,
    'limit': 10,
    'indent': True,
    'key': api_key,
}
url = service_url + '?' + urllib.urlencode(params)
response = json.loads(urllib.urlopen(url).read())
for element in response['itemListElement']:
  print element['result']['name'] + ' (' + str(element['resultScore']) + ')'

上面的脚本返回下面的查询,但我想接收与瑜伽相关的主题,例如健康、健身、健身房等,而不是名称中包含“瑜伽”一词的事物。

Yoga Sutras of Patanjali (71.245544)
Yōga, Tokyo (28.808222)
Sri Aurobindo (28.727333)
Yoga Vasistha (28.637642)
Yoga Hosers (28.253984)
Yoga Lin (27.524054)
Patanjali (27.061115)
Yoga Journal (26.635073)
Kripalu Center (26.074436)
Yōga Station (25.10318)

我非常感谢任何建议,如果有任何我可以使用的 API,我也愿意使用任何其他 API。干杯。

4

1 回答 1

1

明白你的意思:)所以这是我使用 Serpstat 的 API 的脚本。以下是它的工作原理:

  1. 脚本从 Serpstat 的数据库中收集关键字
  2. 然后,从 Serpstat 的数据库中收集搜索建议
  3. 最后,从 Google 的建议中收集搜索建议

请注意,要使脚本正常工作,最好填写所有输入框。但并非所有这些都是必需的。

  • 关键字——必填关键字
  • 搜索引擎——将对其进行分析的搜索引擎。例如,对于美国的 Google,您需要设置 g_us。可在此处找到可用搜索引擎的完整列表。

限制将参与分析的有机问题的最大短语数。此处不能设置超过 1000。

  • 默认键 - 两个词的关键字列表。如果出现问题,您应该给他们每个人一些“权重”以获得某种结果。

格式:类型、关键字、“权重”。每个关键字都应该从新行开始编写。类型:

w——一个词

p——两个词

例子:

"w;bottle;50" — 字瓶的初始重量为 50。

"p;plastic bottle;30" — 短语塑料瓶的初始重量为 30。

“w;塑料瓶;20”——不正确。您不能对“w”类型使用两个词的短语。

坏词 - 您希望脚本从结果中排除的以逗号分隔的单词列表。

令牌 - 在这里您需要输入您的令牌以进行 API 访问。它可以在您的个人资料页面上找到。

您可以在此处下载脚本的源代码

于 2016-12-19T14:27:26.800 回答