我有一个代码可以删除 head 标签中的文本。给我们一个网站的html
for link in soup.findAll('head'):
link.replaceWith("")
我正在尝试用“”替换整个内容。但是,这是行不通的。如何从汤中完全删除头部标签之间的所有文本。
我有一个代码可以删除 head 标签中的文本。给我们一个网站的html
for link in soup.findAll('head'):
link.replaceWith("")
我正在尝试用“”替换整个内容。但是,这是行不通的。如何从汤中完全删除头部标签之间的所有文本。
尝试这个:
[head.extract() for head in soup.findAll('head')]
您需要使用 """(3 个引号),但您似乎只使用了两个引号。
例子:
"""
This block
is commented out
"""
快乐编码!
编辑:这不是用户所要求的,我很抱歉。
我对 Beautiful Soup 没有经验,但我在 SO 上找到了一段可能对您有用的代码(来源):
soup = BeautifulSoup(source.lower())
to_extract = soup.findAll('ahref') #Edit the stuff inside '' to change which tag you want items to be removed from, like 'ahref' or 'head'
for item in to_extract:
item.extract()
不过,从外观上看,它可能只是删除了您页面上的每个链接。
如果这对您没有更多帮助,我很抱歉!