是否可以从网页使用请求中获取 HTML 文本?
import requests
headers = {
'Accept':
'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Encoding':
'gzip, deflate, br',
'Accept-Language':
'ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7,uk;q=0.6',
'Connection':
'keep-alive',
'DNT':
'1',
'Host':
'labor.ny.gov',
'Upgrade-Insecure-Requests':
'1',
'User-Agent':
"Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36",
}
params = {'warnYr': '2018'}
s = requests.Session()
s.get(
'https://labor.ny.gov/app/warn/default.asp?warnYr=2018',
headers=headers,
params=params)
这是行不通的
raise ConnectionError(err, request=request)
requests.exceptions.ConnectionError: ('Connection aborted.', OSError(0, 'Error'))
如果 requests.get - 也不起作用。
也许无法从此网页获取 HTML?
如果不可能,为什么?