python - 无法连接到python中的特定URL

Question

我正在尝试用 Python 连接到Heathrow 奖励网站。我正在尝试使用该RoboBrowser库从页面中抓取数据，但我的连接尝试引发了ReadTimeout错误。我使用的所有其他 URL（即 Waterstones、Maximiles）都运行良好。

我已经尝试连接requests和urllib库，并得到了相同的结果。

我认为这个问题与 SSL 验证有关，所以我将其关闭，但它并没有改变任何东西。

您应该能够通过在我提到的其中一个库中连接到上面的 URL 来为自己复制问题。

from robobrowser import RoboBrowser
browser = RoboBrowser()
browser.open('https://rewards.heathrow.com')

score 0 · Accepted Answer

正如对该问题的评论所建议的那样，这是一个 SSL 版本问题。解决方案是创建一个适配器类，如下所示：在 Python 请求中选择 SSL 版本。

我用来解决问题的代码如下：

class SSLAdapter(HTTPAdapter):
    def __init__(self, ssl_version=None, **kwargs):
        self.ssl_version = ssl_version
        self.poolmanager = PoolManager()
        super().__init__(**kwargs)

    def init_poolmanager(self, connections, maxsize, block=False):
        self.poolmanager = PoolManager(num_pools=connections,
                                       maxsize=maxsize,
                                       block=block,
                                       ssl_version=self.ssl_version)

然后，在创建 RoboBrowser 实例时：

s = Session()
s.mount('https://', SSLAdapter(_ssl.PROTOCOL_TLSv1))
self.browser = RoboBrowser(parser="lxml", session=s, user_agent=user_agent)

python - 无法连接到python中的特定URL

1 回答 1

Related

Reference