我试图使用 dryscrape 和 python来抓取http://quotes.toscrape.com/用于学习目的。我能够使用 class="quote" 获得所有 div。想循环使用 class="quote" 的 div 列表,并使用 xpath 从此父元素获取多个数据。
import dryscrape
from bs4 import BeautifulSoup
session = dryscrape.Session()
url = 'http://quotes.toscrape.com/'
print 'Visiting the URL...'
session.visit(url)
print 'Status: ', session.status_code()
for div in session.xpath("//div[@class='quote']"):
# please help me to scrape author and quote for each div elements