0

我正在尝试获取http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400的渲染标记;理论上与 Firefox 中的“查看页面源代码”菜单选项给出的标记完全相同。

我正在使用 Python 2.7 脚本和httplib(http://docs.python.org/2/library/httplib.html)。我创建了一个 HTTPConnection 对象,当我尝试通过 HTTPResponse 对象的函数获取标记时,不可避免地会收到getaddrinfo - 11004错误。此脚本已在 Windows 7 和 Ubuntu 环境中执行。

我读过的针对此错误的其他解决方案都不符合要求:我不在任何防火墙后面,而且我在 ping www.google.com 时没有问题。我想知道该网站是否不符合我不知道的某些标准,因为我无法成功 ping 我的目标网站

我对其他方法持开放态度,如果有更好的方法,请告诉我。

4

1 回答 1

0

reqests你可能想去图书馆看看。它使像这样的简单事情变得容易得多:

import requests

r = requests.get('http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400')

print r.text

以下是文档:http ://docs.python-requests.org/en/latest/

运行上述并验证它有效。

于 2013-01-15T02:18:03.530 回答