我正在使用 PHPs DOM 来构建 HTML 文档。
在文档的最后,我创建了一个脚本元素。
如果脚本有任何实体,特别是 < 和 >,那么这些将被转换为 < 和>
如果我有任何包含这些字符的字符串(或者在我的情况下是正则表达式),这显然是一个问题
是否有一种非 hackish 方式(即不是字符串替换)来仅在脚本标签中防止这种行为?
我正在使用 PHPs DOM 来构建 HTML 文档。
在文档的最后,我创建了一个脚本元素。
如果脚本有任何实体,特别是 < 和 >,那么这些将被转换为 < 和>
如果我有任何包含这些字符的字符串(或者在我的情况下是正则表达式),这显然是一个问题
是否有一种非 hackish 方式(即不是字符串替换)来仅在脚本标签中防止这种行为?
这通常不是问题。这些字符仅被编码为<
或者>
如果您使用DOMDocument::saveXML()
. 如果您使用DOMDocument::saveHTML()
这些只是在标签中<
。>
<script>
例子:
<?php
/**
* PHP DOM and JavaScript with HTML entities
*
* @link http://stackoverflow.com/q/18487515/367456
*/
$doc = new DOMDocument("1.0");
$doc->loadXML('<head/>');
$javascriptCode = "\n if (1 < 4) {\n alert(\"hello\");\n }\n";
$script = $doc->createElement('script');
$script->appendChild($doc->createCDATASection($javascriptCode));
$head = $doc->getElementsByTagName('head')->item(0);
$scriptInHead = $head->appendChild($script);
echo 'libxml: ', LIBXML_DOTTED_VERSION, "\n"
, "\nXML:\n", $doc->saveXML()
, "\nHTML:\n", $doc->saveHTML()
;
程序输出(演示(多版本)):
libxml: 2.7.8
XML:
<?xml version="1.0"?>
<head><script><![CDATA[
if (1 < 4) {
alert("hello");
}
]]></script></head>
HTML:
<head><script>
if (1 < 4) {
alert("hello");
}
</script></head>