0

我正在使用 PHPs DOM 来构建 HTML 文档。

在文档的最后,我创建了一个脚本元素。

如果脚本有任何实体,特别是 < 和 >,那么这些将被转换为 < 和>

如果我有任何包含这些字符的字符串(或者在我的情况下是正则表达式),这显然是一个问题

是否有一种非 hackish 方式(即不是字符串替换)来仅在脚本标签中防止这种行为?

4

1 回答 1

2

这通常不是问题。这些字符仅被编码为&lt;或者&gt;如果您使用DOMDocument::saveXML(). 如果您使用DOMDocument::saveHTML()这些只是在标签中<><script>

例子:

<?php
/**
 * PHP DOM and JavaScript with HTML entities
 *
 * @link http://stackoverflow.com/q/18487515/367456
 */

$doc = new DOMDocument("1.0");
$doc->loadXML('<head/>');

$javascriptCode = "\n  if (1 < 4) {\n    alert(\"hello\");\n  }\n";

$script = $doc->createElement('script');
$script->appendChild($doc->createCDATASection($javascriptCode));

$head         = $doc->getElementsByTagName('head')->item(0);
$scriptInHead = $head->appendChild($script);

echo 'libxml: ', LIBXML_DOTTED_VERSION, "\n"
    , "\nXML:\n", $doc->saveXML()
    , "\nHTML:\n", $doc->saveHTML()
;

程序输出(演示(多版本)):

libxml: 2.7.8

XML:
<?xml version="1.0"?>
<head><script><![CDATA[
  if (1 < 4) {
    alert("hello");
  }
]]></script></head>

HTML:
<head><script>
  if (1 < 4) {
    alert("hello");
  }
</script></head>
于 2013-08-28T12:27:02.713 回答