我拥有的用于解析网站的部分代码不起作用。
我可以将问题追溯到.read
我的 urllib2.urlopen 对象的功能。
page = urllib2.urlopen('http://magiccards.info/us/en.html')
data = page.read()
直到昨天,这还不错;但是现在数据的长度始终是 69496 而不是 122989,但是当我打开较小的页面时,我的代码可以正常工作。
我已经在 Ubuntu、Linux Mint 和 windows 7 上对此进行了测试。它们都有相同的行为。
我假设 Web 服务器上发生了一些变化;但是当我使用网络浏览器时页面是完整的。我试图用wireshark诊断问题,但页面被完整接收。
有人知道为什么会发生这种情况,或者我可以尝试确定问题吗?