我有一堆 HTML 数据正在使用 PHP 写入 PDF 文件。在 PDF 中,我希望剥离和清理所有 HTML。例如:
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
应该变成:
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
但是,如果我简单地使用strip_tags()
,我会得到这样的结果:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
还要注意输出的缩进。
关于如何正确地将 HTML 清理为漂亮、干净的字符串而没有混乱的空格和奇怪的字符的任何提示?
谢谢 :)