确实,BeautifulSoup 并不那么容易理解,但它有时会非常有用;)
因此,重新以 FlopCoder 为例并对其进行更多解释:
html = # HTML Code #maybe parsed from a website
soup = BeautifulSoup(html) #you create a soup object with your html code
x = soup.find('span', {'class' : 'on'}) #Search for the first span balise in the code, whith class : on
print x.text #Find the found balise, .text mean only the text inside the <>text</>
如果您有不止一个需要找到您需要做的事情:
x = soup.findAll('span', {'class' : 'on'})
for span in x:
print span.text
最后一个示例使用 findAll。它使用代码中的 Class:On 创建一个包含所有跨度应答器的列表。那么你可以运行一个for。
your_object.text --> 返回文本
your_object.a --> 返回链接(等等...)
希望它可以帮助一点点!