1

作为 Python 新手,我花了大约一个小时试图从 div 内的标题中找到一个带有 Python 2.7.x 和 Beautiful Soup 的字符串:

import urllib2
from bs4 import BeautifulSoup

request = urllib2.Request("http://somerandomurl.org")
response = urllib2.urlopen(request)
soup = BeautifulSoup(response)

HTML 文件如下所示:

<div class="ABC">
    <h1>My string</h1>
</div>

我无法描述我在这里尝试的Beautiful Soup Documentationprint soup.div('ABC').h1的所有方式(包括……),但我认为我在阅读时遇到了严重的错误。谢谢你的帮助。

4

1 回答 1

3

你自找的:

soup.find('div', class_='ABC').h1

它将找到该类的第一个 div标签ABC,然后遍历其中的第一个 H1 标签:

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('''
... <div class="ABC">
...     <h1>My string</h1>
... </div>
... ''')
>>> soup.find('div', class_='ABC').h1
<h1>My string</h1>
于 2013-03-12T22:09:25.733 回答