我正在使用请求库来检查一些 URL。目的是看看他们是否还活着。代码很简单
import requests
def checkurlalive(url):
r = requests.head(url,timeout=10)
if r.ok:
return True
else:
return False
但是,它不适用于以下 URL:
http://ieeexplore.ieee.org/ielx5/6294/4804034/04804053.pdftp=&arnumber=4804053&isnumber=4804034
此 URL 在我的计算机上有效,因为它显示了一个 PDF 文件,但是,上面的方法给了我一个 requests.exceptions.Timeout 错误。
另一方面,以下网址:
http://www.wartsila.com/ss/Satellite?blobcol=urldata&blobheader=JPG&blobkey=id&blobtable=MungoBlobs&blobwhere=1278606917069&ssbinary=trueaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
不应该是一个有效的 URL,但上面的方法给了我一个积极的结果。
怎么可能?