我想从找到的所有图像中删除“a”标签(链接)。因此,为了提高性能,我列出了 html 中的所有图像,并寻找包装标签并简单地删除链接。
我正在使用 BeautifulSoup 并且不确定我做错了什么,而不是删除 a 标签,而是删除了内部内容。
这就是我所做的
from bs4 import BeautifulSoup
html = '''<div> <a href="http://somelink"><img src="http://imgsrc.jpg" /></a> <a href="http://somelink2"><img src="http://imgsrc2.jpg /></a>" '''
soup = BeautifulSoup(html)
for img in soup.find_all('img'):
print 'THIS IS THE BEGINING /////////////// '
#print img.find_parent('a').unwrap()
print img.parent.unwrap()
这给了我以下输出
> >> print img.parent()
<a href="http://somelink"><img src="http://imgsrc.jpg" /></a>
<a href="http://somelink2"><img src="http://imgsrc2.jpg /></a>
> >> print img.parent.unwrap()
<a href="http://somelink"></a>
<a href="http://somelink2"></a>
当我使用replaceWith
或replaceWithChildren
object.parent
findParent
我不确定我做错了什么。自从我开始使用 python 以来只有几周的时间。