我是 python 新手,我正在构建一个用于娱乐/教育目的的网络爬虫。我没有使用任何递归函数,但我仍然收到“RuntimeError:超出最大递归深度”错误。我真的很困惑,有点觉得我错过了一些明显的东西或者只是误解了一些东西。我是否以某种方式递归,或者它可能与我的大循环有关?这个想法是爬取网络,直到你爬取了 10k 个页面。
更新:
最新代码在这里: http: //pastebin.com/4v5GT7ft
堆栈跟踪在这里: http: //pastebin.com/9GzAxZM9
看起来我的问题是尝试在未正确编码的 URL 上调用 str()。我尝试解码 URL,然后将它们编码为 unicode,但我从来没有成功地做到这一点。任何建议将不胜感激!