我想在我的计算机上复制一个托管在网站上的数据库。
我尝试使用 python urllib2 并创建一个循环来打开每个链接并编写一个包含页面内容的文件。它大约适用于前一百个链接,然后我收到错误 500,似乎网站也已关闭(运行时错误)。
是因为数据库中的安全机制吗?有什么技巧可以避免吗?
谢谢!
我还收到 HTTP 500(内部服务器错误)。所以我不认为这是一种安全机制,而可能是真正的服务器错误。
也许您的爬虫“点击”了导致服务器崩溃的链接?当然,服务器错误也可能完全独立于您的爬网工作。
无论如何,如果问题仍然存在,可能值得使用此处提供的联系方式联系数据库所有者:http: //archive.unctad.org/iia-dbcases/