我有大量的 html 文本数据集,并且我经常发现标签<br>
内的换行符是不必要的,有时甚至是多个换行符。<li>
例如:
<li>Some string here<br></li><br><li>Another string here<br><br></li><br>
我想删除这些<br>
出现在标签之间<li>
并</li>
保留其他所有内容,包括标签<br>
之外的内容。<li>
上面的文本将变为:
<li>Some string here</li><br><li>Another string here</li><br>
使用 php 中的 preg_replace() (或 python 中的 re.sub() )执行此操作的正则表达式是什么?