是否可以使用 python 获取网页的前几个,比如 1K?
非常感谢你!
Requests库允许您在响应进入时对其进行迭代,以便您可以执行以下操作:
import requests
beginning = requests.get('http://example.com/').iter_content(1024).next()
如果您只想要标头,您可以随时使用 http HEAD 方法:
req = requests.head('http://example.com')
这是一个使用 Python 3内置的urllib.request的示例。
import urllib.request
url = urllib.request.openurl("http://example.com").read(1024)
当然:
>>> len(urllib2.urlopen('http://google.com').read(1024))
1024