我正在构建一个 Django 应用程序,并且正在使用 Spynner 进行网络抓取。我有这个问题,我希望有人可以帮助我。
我在模块“crawler.py”中有这个功能:
import spynner
def crawling_js(url)
br = spynner.Browser()
br.load(url)
text_page = br.html
br.close (*)
return text_page
(*) 我在另一个模块中也尝试过使用 br.close()
(例如:“import.py”)我以这种方式调用该函数:
from crawler import crawling_js
l_url = ["https://www.google.com/", "https://www.tripadvisor.com/", ...]
for url in l_url:
mytextpage = crawling_js(url)
.. parse mytextpage....
当我将第一个 url 传递给函数时,当我传递第二个“url”python 崩溃时,一切都是正确的。Python 在这一行崩溃:br.load(url)。有人可以帮助我吗?非常感谢
我有: Django 1.3 Python 2.7 Spynner 1.1.0 PyQt4 4.9.1