给定一些简单的 XHTML,我想创建一个人类可读的纯文本版本。这将涉及删除所有 HTML 标记,但添加或保留一些空格。
例如,这个输入:
<div>
<p>This is some text, some is <b>bold</b>.</p>
<ul>
<li>Point one</li>
<li>Point two</li>
</ul>
</div>
会成为:
"This is some text, some is bold. Point one Point two"
(LI 之间的逗号是理想的...... :)