4

我正在对大量链接执行状态检查,我的代码段如下:

link = 'http://xyz'
proxyDict = { "http" : "ip:80", "https" : "https://ip:443"}
r = requests.get(link, allow_redirects=False, verify=False)
http_status = r.status_code
print (r.headers)

# check the status and react accordingly

if http_status == 200 and r.headers['content-length'] == "0":
   print ('Link Alive - NO content'+';'+str(http_status)+';'+link, file = log)
elif http_status == 200 and "text/html" in r.headers['content-type']:
   print ('External- direct HTML link'+';'+str(http_status)+';'+link, file = log)  
elif http_status == 200 and "application" in r.headers['content-type']:
   print ('External- direct HTML link'+';'+str(http_status)+';'+link, file = log)

当我执行代码时,出现以下错误:

    return self._store[key.lower()][1]
    KeyError: 'content-length'

头文件输出如下:

CaseInsensitiveDict({'status': '200', path=/; HttpOnly, shpuvid=rBBcnFJUTliSHV+hA5lLAg==; expires=Thu, 08-Oct-15 18:26:32 GMT;'connection': 'keep-alive', 'cache-control': 'max-age=0, private, must-revalidate', 'date': 'Tue, 08 Oct 2013 18:26:32 GMT', 'content-type': 'text/html; charset=utf-8', 'x-rack-cache': 'miss'})

我知道错误的存在是因为header output没有关键的“内容长度”,但是当if condition它不满足时必须跳转到下一个elif不会发生的条件,而是停止代码执行并抛出上述错误。

有什么建议么?可能是一个愚蠢的问题,但对于初学者来说是一件好事。

4

3 回答 3

10

不要使用方括号符号,而是使用字典中的 r.headers.get('content-length') ,它不会抛出键错误,而是简单地返回 None。

您可以使用任何一种表示法从字典中检索值,这很好。很多时候,您希望抛出该关键错误,以免忽视问题。在这种情况下,dictionary.get() 似乎是您想要的。

于 2013-10-08T18:39:12.753 回答
3

密钥错误通常意味着密钥不存在。

我猜 self._store[key.lower()][1] 无效(不存在)

来自官方 python 文档:

异常键错误

当在现有键集中找不到映射(字典)键时引发。

于 2013-10-08T18:40:09.450 回答
0

问题可能在请求本身内部。

当对 requests.get() 的多次调用被定向到同一个服务器时,请求包中有一些异步行为会导致问题。

https://blog.petrzemek.net/2018/04/22/on-incomplete-http-reads-and-the-requests-library-in-python/

于 2019-07-27T19:07:50.523 回答