我有来自用户的段落输入。但是,总是有前导或尾随<br>
、空<p>
或空<div>
,它们根本没有意义,它们会影响输出的格式。如何在 Python 中很好地正确地剥离它们?
用户输入的示例如下:
<br><div></div>
<div>Hello <a href="world.html">World!</a>.</div>
<br><br>
<div>Image below:<br>
<img src="abc.jpg" /><br><br></div><p></p>
我想要的理想结果是:
<div>Hello <a href="world.html">World!</a>.</div>
<br /><br />
<div>Image below:<br />
<img src="abc.jpg" /></div>
谢谢你。