我是 python 的新手,我正在尝试使用 Python 中的 beautifulSoup 从网站上抓取一些文本评论。部分html结构如下,
<div style="1st level">
<div style="2nd level">Here is text 1</div>
<div style="2nd level">Here is text 2</div>
<div style="2nd level">Here is text 3</div>
<div style="2nd level">Here is text 4</div>
Here is text 5 and this is the part I want to get.
<div>
所以文本 1,2,3,4 在第二级,我不需要这些文本。我只想获取位于结构第一级的文本 5。我的部分代码如下:
reviews=soup.find('div',style="1st level")
reviews=reviews.text
print reviews
但是后来我得到了从文本 1 到文本 5 的所有内容。有没有一种简单的方法可以定位到第一级并且只获取文本 5?