这些是python爬虫中的定义:
from __future__ import with_statement
from eventlet.green import urllib2
import eventlet
import re
import urlparse
from bs4 import BeautifulSoup, SoupStrainer
import sqlite3
import datetime
如何将旋转代理(每个打开线程一个代理)添加到在 BeautifulSoup 上工作的递归 cralwer?
如果我使用 Mechanise 的浏览器,我知道如何添加代理:
br = Browser()
br.set_proxies({'http':'http://username:password@proxy:port',
'https':'https://username:password@proxy:port'})
但我想具体了解 BeautifulSoup 需要什么样的解决方案。
非常感谢您的帮助!