python - getaddrinfo 11004 和 python 的 httplib

Question

我正在尝试获取http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400的渲染标记；理论上与 Firefox 中的“查看页面源代码”菜单选项给出的标记完全相同。

我正在使用 Python 2.7 脚本和httplib库(http://docs.python.org/2/library/httplib.html)。我创建了一个 HTTPConnection 对象，当我尝试通过 HTTPResponse 对象的函数获取标记时，不可避免地会收到getaddrinfo - 11004错误。此脚本已在 Windows 7 和 Ubuntu 环境中执行。

我读过的针对此错误的其他解决方案都不符合要求：我不在任何防火墙后面，而且我在 ping www.google.com 时没有问题。我想知道该网站是否不符合我不知道的某些标准，因为我无法成功 ping 我的目标网站。

我对其他方法持开放态度，如果有更好的方法，请告诉我。

score 0 · Accepted Answer

reqests你可能想去图书馆看看。它使像这样的简单事情变得容易得多：

import requests

r = requests.get('http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400')

print r.text

以下是文档：http ://docs.python-requests.org/en/latest/

运行上述并验证它有效。

python - getaddrinfo 11004 和 python 的 httplib

1 回答 1

Related

Reference