我从一个我正在抓取的网站上获得以下内容,但不幸的是,该内容还包含一些字体标签,并且将来可能包含其他内联格式。我正在使用 PHPQuery 来执行此操作,但仅 PHP 的解决方案也可以。
<p>
<font
color="#cc0000">
<font
color="#000000">Content</font>
</font>
</p>
<p>Content</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#cc0000">Content I wish to keep but font should be removed</font>
</p>
<p>
<font
color="#000000">Content I wish to keep but font should be removed</font>
</p>
<p>Content</p>
</div>