我正在尝试使用 file_get_contents 读取 html 页面。在我处理完数据后,有一些不完整的标签,例如:
</p><p> test test test test</p>
在这种情况下,没有<p>
要打开的</p>
或者
<font color="#333333">abc</font><div><p>go go go go </p>
在这种情况下,没有</div>
要关闭的<div>
因此我想使用 preg_replace 删除所有这些不完整的标签,在我的例子中,额外的</p>
和<div>
应该被删除。我怎样才能做到这一点?这些标签可以是任何有效的 html5 标签。