您如何处理 XML 文件中的损坏数据?例如,如果我有
<text>Some &improper; text here.</text>
我正在尝试做:
$doc = new DOMDocument();
$doc->validateOnParse = false;
$doc->formatOutput = false;
$doc->load(...xml');
它失败了,因为有一个未知的实体。注意,由于软件的编写方式,我不能使用 CDATA。我正在编写一个读取和写入 XML 的模块,有时用户会插入不正确的文本。
我注意到 DOMDocument->loadHTML() 很好地编码了所有内容,但是我怎么能从那里继续呢?