我正在尝试访问网页并检查网站所有者是否允许与他联系..
这是http://pastebin.com/12rLXQaz
这是每个线程调用的函数:
def getpage():
try:
curl = urls.pop(0)
print "working on " +str(curl)
thepage1 = requests.get(curl).text
global ctot
if "Contact Us" in thepage1:
slist.write("\n" +curl)
ctot = ctot + 1
except:
pass
finally:
if len(urls)>0 :
getpage()
但问题是程序的内存不断增加..(pythonw.exe)
当线程再次调用该函数时,条件为真.. 程序的内存应至少大致保持在同一水平。
对于包含大约 10 万个 URL 的列表,该程序占用的空间远远超过 3GB 并且还在增加……