1

我正在查询带有漂亮汤的标签

scriptResults = soup3('script')
soup3 = BeautifulSoup(page3)

我如何确定找到的每个脚本结果是在 head 还是 body 标记中?

最简单的方法是提取头部,提取主体,然后分别检查每个中的脚本标签吗?

4

1 回答 1

1

您可以在传递给 BS 之前拆分源:

parts = html.split('</head>')
head = parts[0]
body = parts[1]

head_soup = BeautifulSoup(head)
body_soup = BeautifulSoup(body)

在此之后,只需检查每个汤中是否存在脚本标签。

于 2013-03-29T13:40:47.093 回答