有人可以解释一下findAll
BeautifulSoup 的工作原理吗?
我的疑问是这一行:A = soup.findAll('strong',{'class':'name fn'})
。看起来像是找到了一些符合某些条件的字符。
但是网页的原始代码是这样的<STRONG class="name fn">iPod nano 16GB</STRONG>
............
怎么('strong',{'class':'name fn'})
捡起来的?谢谢。
原始 Python 代码
from bs4 import BeautifulSoup
import urllib2
import re
url="http://m.harveynorman.com.au/ipods-audio-music/ipods/ipods"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
A = soup.findAll('strong',{'class':'name fn'})
for B in A:
print B.renderContents()