注意:XML 验证可能会受到Billion Laughs攻击和类似的 DoS 攻击。
这基本上就是 rojoca 在他的评论中提到的:
<?php
$xml = <<<END
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE foo SYSTEM "foo.dtd">
<foo>
<bar>baz</bar>
</foo>
END;
$root = 'foo';
$old = new DOMDocument;
$old->loadXML($xml);
$creator = new DOMImplementation;
$doctype = $creator->createDocumentType($root, null, 'bar.dtd');
$new = $creator->createDocument(null, null, $doctype);
$new->encoding = "utf-8";
$oldNode = $old->getElementsByTagName($root)->item(0);
$newNode = $new->importNode($oldNode, true);
$new->appendChild($newNode);
$new->validate();
?>
这将根据bar.dtd
.
您不能只调用$new->loadXML()
,因为这只会将 DTD 设置为原始,并且doctype
DOMDocument 对象的属性是只读的,因此您必须将根节点(其中包含所有内容)复制到新的 DOM 文档。
我自己只是尝试过,所以我不完全确定这是否涵盖了所有内容,但它绝对适用于我的示例中的 XML。
当然,快速而简单的解决方案是首先获取 XML 作为字符串,搜索并用您自己的 DTD 替换原始 DTD,然后加载它。