1

我有一个代码可以删除 head 标签中的文本。给我们一个网站的html

    for link in soup.findAll('head'):
        link.replaceWith("")

我正在尝试用“”替换整个内容。但是,这是行不通的。如何从汤中完全删除头部标签之间的所有文本。

4

2 回答 2

1

尝试这个:

[head.extract() for head in soup.findAll('head')]
于 2013-10-24T17:23:36.667 回答
0

您需要使用 """(3 个引号),但您似乎只使用了两个引号。

例子:

"""
This block
is commented out
"""

快乐编码!

编辑:这不是用户所要求的,我很抱歉。

我对 Beautiful Soup 没有经验,但我在 SO 上找到了一段可能对您有用的代码(来源):

soup = BeautifulSoup(source.lower())
to_extract = soup.findAll('ahref') #Edit the stuff inside '' to change which tag you want items to be removed from, like 'ahref' or 'head'
for item in to_extract:
    item.extract()

不过,从外观上看,它可能只是删除了您页面上的每个链接。

如果这对您没有更多帮助,我很抱歉!

于 2013-10-24T17:08:59.050 回答