python - 与另一端的连接以不干净的方式丢失

Question

from scrapy.spider import BaseSpider

class dmozSpider(BaseSpider):
    name = "dmoz"
    allowed_domains = ["dmoz.org"]
    start_urls = [
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
    ]

    def parse(self, response):
        filename = response.url.split("/")[-2]
        open(filename, 'wb').write(response.body)

然后我运行“scrapy crawl dmoz”然后我得到了这个错误：

2013-09-14 13:20:56+0700 [dmoz] 调试：重试 http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/>（失败 1 次）：连接到另一端以不干净的方式迷失。

有谁知道如何解决这一问题？

score 2 · Accepted Answer

您需要检查您的互联网连接，或者如果您使用代理，请设置您的环境变量以进行代理身份验证。

在 Windows 中，请尝试以下步骤：

Win+R输入“systempropertiesadvanced”（不带引号）
单击“环境变量...”按钮
添加 2 个新变量（用户/系统变量都可以）：

姓名 | 价值
------------+--------------------------------  
HTTP_PROXY | http://用户名：密码@主机：端口
HTTPS_PROXY | https://用户名：密码@主机：端口

替代方式：设置代理环境

python - 与另一端的连接以不干净的方式丢失

1 回答 1

Related

Reference