我正在使用 BeautifulSoup 进行一些 HTML 清理。Python 和 BeautifulSoup 的新手。根据我在 Stackoverflow 其他地方找到的答案,我已经正确删除了标签,如下所示:
[s.extract() for s in soup('script')]
但是如何删除内联样式?例如以下:
<p class="author" id="author_id" name="author_name" style="color:red;">Text</p>
<img class="some_image" href="somewhere.com">
应该变成:
<p>Text</p>
<img href="somewhere.com">
如何删除所有元素的内联类、id、名称和样式属性?
其他类似问题的答案我可以找到所有提到的使用 CSS 解析器来处理这个问题,而不是 BeautifulSoup,但由于任务只是删除而不是操纵属性,并且是所有标签的一揽子规则,我希望找到一种在 BeautifulSoup 中完成这一切的方法。