1

我有一个网站,我想从中下载文件。大约每隔一天上传一个新文件。如何检查新文件是否已启动?

例如:url1 = website.com/file_2013-06-27.zip <-- 上传

url2 = website.com/file_2013-06-29.zip <-- 未上传

如果我转到 url 2,它会在 5 秒内重定向回 website.com,它的源代码是:<meta http-equiv="refresh" content="5;url=http://website.com" /> Error: 2 [ Not Allowed ]

文件的大小为 100mb+,如果我尝试通过 do 来查看源urllib.urlopen("website.com/file_2013-06-27.zip").read(),如果文件存在则需要一段时间。

有什么方法可以快速检查是否上传了新文件?

谢谢

4

1 回答 1

1

Python 的 Requests 库非常适合检查 HTTP 状态代码等内容(不下载文件,只是获取响应)

例如:

import requests

r = requests.get('website.com/file_2013-06-27.zip')
if r.status_code == 200:
    print ("File uploaded.")

这不会下载文件(只是尝试使用 1GB 文件),只是检查 Web 服务器是否会提供它以及 HTTP 响应是什么。对于 HTTP,200 表示文件存在并且可以访问。有关 HTTP 响应代码的更多信息,请参见下文。

更多信息:
http ://docs.python-requests.org/en/latest/ - 请求库
http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html - HTTP 响应代码指南

于 2013-07-01T22:35:56.813 回答