0

我有一个带有“代码”标签的字符串,我想删除这些标签以及这些标签中的所有内容。例如,

"hello how are <code>this is my code</code> you"

变成

"hello how are you"

我很确定 BeautifulSoup 是适合这项工作的工具,但是我查看了文档,但我无法弄清楚如何做到这一点。

谢谢

4

1 回答 1

4

容易Tag.extract()

>>> from bs4 import BeautifulSoup as BS
>>> s = "hello how are <code>this is my code</code> you"
>>> soup = BS(s)
>>> codetags = soup.find_all('code')
>>> for codetag in codetags:
...    codetag.extract()
>>> print soup
hello how are  you
于 2013-09-14T23:22:41.357 回答