我刚刚从urllib2
用作我的 HTTP 访问库切换到使用该request
库。在 urllib 中,您使用BeautifulSoup
该函数来拉取 html 元素findAll(tag='element')
,我是继续以相同的方式使用 BeautifulSoup 还是 request 具有简化此过程的函数?
使用 urllib2 拉取标签
import urllib2
from bs4 import BeautifulSoup as BS
response = urllib2.urlopen('http://stackoverflow.com/')
soup = BS(response)
for a in soup.findAll('a'):
print a['href]
使用请求拉取标签
import response
response = request.get('http://stackoverflow.com/')
for a in response.findAll('a'):
print a['href]