python - 是否可以从网页使用请求中获取 HTML 文本？

翻译自：https://stackoverflow.com/questions/55216781 2019-03-18T07:55:32.810

130 次

是否可以从网页使用请求中获取 HTML 文本？

import requests

headers = {
    'Accept':
    'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
    'Accept-Encoding':
    'gzip, deflate, br',
    'Accept-Language':
    'ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7,uk;q=0.6',
    'Connection':
    'keep-alive',
    'DNT':
    '1',
    'Host':
    'labor.ny.gov',
    'Upgrade-Insecure-Requests':
    '1',
    'User-Agent':
    "Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36",
}

params = {'warnYr': '2018'}

s = requests.Session()

s.get(
    'https://labor.ny.gov/app/warn/default.asp?warnYr=2018',
    headers=headers,
    params=params)

这是行不通的

raise ConnectionError(err, request=request)
requests.exceptions.ConnectionError: ('Connection aborted.', OSError(0, 'Error'))

如果 requests.get - 也不起作用。
也许无法从此网页获取 HTML？
如果不可能，为什么？

python - 是否可以从网页使用请求中获取 HTML 文本？

0 回答 0

Related

Reference