5

我已经在http://www.developers.elsevier.com/action/devprojects注册了。我创建了一个项目并获得了我的 scopus 密钥:

在此处输入图像描述

现在,使用这个生成的密钥,我想通过 和 查找firstname作者。我从允许访问 Scopus 的大学网络发出请求(我可以完全手动访问 Scopus 搜索,从 Firefox 使用它没有问题)。但是,我想通过编写一个简单的脚本来自动化我的 Scopus 挖掘。我想通过给出他/她的,和来查找作者的出版物。lastnamesubjectareafirstnamelastnamesubjectarea

这是我的代码:

# !/usr/bin/env python
# -*- coding: utf-8 -*-

import requests
import json
from scopus import SCOPUS_API_KEY


scopus_author_search_url = 'http://api.elsevier.com/content/search/author?'
headers = {'Accept':'application/json', 'X-ELS-APIKey': SCOPUS_API_KEY}
search_query = 'query=AUTHFIRST(%) AND AUTHLASTNAME(%s) AND SUBJAREA(%s)' % ('John', 'Kitchin', 'COMP')

# api_resource = "http://api.elsevier.com/content/search/author?apiKey=%s&" % (SCOPUS_API_KEY)

# request with first searching page
page_request = requests.get(scopus_author_search_url + search_query, headers=headers)
print page_request.url

# response to json
page = json.loads(page_request.content.decode("utf-8"))
print page

哪里SCOPUS_API_KEY看起来像这样:SCOPUS_API_KEY="xxxxxxxx"

虽然我可以从我的大学网络完全访问 scopus,但我得到了这样的回应:

{u'service-error': {u'status': {u'statusText': u'Requestor 配置设置不足以访问此资源。', u'statusCode': u'AUTHENTICATION_ERROR'}}}

生成的链接如下所示:http://api.elsevier.com/content/search/author?query=AUTHFIRST(John)%20AND%20AUTHLASTNAME(Kitchin)%20AND%20SUBJAREA(COMP)当我点击它时,它显示一个 XML 文件:

<service-error><status>
  <statusCode>AUTHORIZATION_ERROR</statusCode>
  <statusText>No APIKey provided for request</statusText>
</status></service-error>

或者,当我更改为时,scopus_author_search_url"http://api.elsevier.com/content/search/author?apiKey=%s&" % (SCOPUS_API_KEY)得到:

{u'service-error': {u'status': {u'statusText': u'Requestor configuration settings insufficient for access to this resource.', u'statusCode': u'AUTHENTICATION_ERROR'}}}和 XML 文件:

<service-error>
<status>
<statusCode>AUTHENTICATION_ERROR</statusCode>
<statusText>Requestor configuration settings insufficient for access to this resource.</statusText>
</status>
</service-error>

这个问题的原因可能是什么,我该如何解决?

4

2 回答 2

4

我刚刚注册了一个 API 密钥并首先使用此 URL 对其进行了测试:

http://api.elsevier.com/content/search/author?apikey=4xxxxxxxxxxxxxxxxxxxxxxxxxxxxx43&query=AUTHFIRST%28John%29+AND+AUTHLASTNAME%28Kitchin%29+AND+SUBJAREA%28COMP%29

这在我的大学网络中运行良好。我还测试了第二个 API 密钥,因此验证了一个在我的大学域上注册了网站,一个在注册网站http://apitest.example.com上进行了验证,排除了用于注册的域名作为问题的根源。

我测试了这个

  1. 在浏览器中,
  2. 在标头中使用带有 api 键的 python 代码。我对您的代码所做的唯一更改是删除

    from scopus import SCOPUS_API_KEY
    

    并添加

    SCOPUS_API_KEY ='4xxxxxxxxxxxxxxxxxxxxxxxxxxxxx43'
    
  3. 使用适合将 apikey 放入 URL 而不是标头的 python 代码。

在所有情况下,查询都会返回两位作者,一位在卡内基梅隆大学,一位在帕洛阿尔托。

我无法复制您的错误消息。如果我尝试使用未在 elsevier 注册的 IP 地址(例如我的家用计算机)中的 API 密钥,我会看到另一个错误:

<service-error>
  <status>
    <statusCode>AUTHENTICATION_ERROR</statusCode>
    <statusText>Client IP Address: xxx.yyy.aaa.bbb does not resolve to an account</statusText>
   </status>
</service-error>

如果我使用大学网络中的随机(错误)API 密钥,我会看到

<service-error>
    <status>
        <statusCode>AUTHORIZATION_ERROR</statusCode>
        <statusText>APIKey <mad3upa1phanum3r1ck3y> with IP address <my.uni.IP.add> is unrecognized or has insufficient privileges for access to this resource</statusText>
    </status>
</service-error>

调试步骤

由于我无法复制您的问题 - 以下是您可以用来解决的一些诊断步骤:

  1. 使用您的浏览器在 uni 中使用您的 URL 中的密钥实际提交 api 查询(即复制上面的 URL,将其粘贴到地址栏中,替换您的密钥并查看是否返回 XML)

  2. 如果 1 返回您期望的 XML,则继续通过 Python 提交请求 - 首先,将确切的 URL 直接复制到 Python 中(通过 没有变量替换%s,标头中没有 apikey),然后简单地.get()对其进行操作。

  3. 如果 2 返回正确,请确保您SCOPUS_API_KEY持有准确的键值,不多不少。即print 'SCOPUS_API_KEY'应该返回你的apikey:4xxxxxxxxxxxxxxxxxxxxxxxxxxxxx43

  4. 如果 1 返回错误,则您的 uni(无论出于何种原因)似乎无法访问作者查询 API。鉴于您可以执行手动搜索,这没有多大意义,但这就是我能得出的结论

文档

作为参考,身份验证算法文档在这里,但不是很容易遵循。您正在遵循身份验证选项 1,您的方法应该可以正常工作。

NB API 限制为每周 5000 次作者检索。如果您在一个循环中运行了很多查询,即使它们失败了,您也有可能超出了...

于 2015-08-19T11:38:50.160 回答
1

备查。OP 使用的是scopus早已重命名为pybliometrics.

现在你可以做

from pybliometrics.scopus import AuthorSearch

q = "AUTHFIRST(John) AND AUTHLASTNAME(Kitchin) AND SUBJAREA(COMP)"
s = AuthorSearch(q)  # handles access, retrieval, parsing and even caches results
print(s)
results = s.authors  # Holds all the information as a list of namedtuples
print(results)  # You can put this into a pandas DataFrame as well
于 2020-08-29T16:54:25.590 回答