一个网络爬虫脚本,最多产生 500 个线程,每个线程基本上请求从远程服务器提供的某些数据,每个服务器的回复在内容和大小上都与其他服务器不同。
我将 stack_size 设置为线程的 756K
threading.stack_size(756*1024)
这使我能够拥有足够数量的所需线程并完成大部分工作和请求。但是由于某些服务器的响应比其他服务器大,并且当一个线程获得这种响应时,脚本会因 SIGSEGV 而死。
stack_sizes 超过 756K 使得不可能同时拥有所需数量的线程。
关于如何在不崩溃的情况下继续使用给定的 stack_size 的任何建议?以及如何获取任何给定线程的当前使用的 stack_size?