我将在这里冒昧地说,htmlspecialchars()
当您将先前提交的数据加载到表单中时,您没有输出 - 但是,您应该这样做,因为它仍然是textarea的文本。您的所见即所得将文本解释为 HTML,但不要将其与实际 HTML 混淆。:)
作为安慰,请知道这种混乱非常普遍(它一直在 发生),并且有很多很多人的问题与您描述的完全一样。
让我们看一下工作流程以及可能出错的地方:
问题工作流程
当有人<tag>
在加载 WYSIWYG 的情况下写入 WYSIWYG 字段中的富文本时,编辑器会看到有人想要将 HTML<tag>
放入消息中。
当有人将粗体文本写入富文本时,编辑器会看到有人想要将 HTML <b>bold text</b>
(或类似的)放入消息中。
同时,在后台,文本<tag> <b>bold text</b>
(或其他)存储在textarea中。为了将文本保留为HTML 上下文中的文本,它使用 HTML 编码进行编码,无形地将其转换为&lt;tag&gt; <b>bold text</b>
.
但是,当您按下提交按钮时,textarea ( ) 的文本会<tag> <b>bold text</b>
发送到您的服务器,因为表单数据本身当然不是 HTML 编码的(它没有嵌入 HTML 中)——它只是一组键和值,并且您想要 textarea 的值。
现在,当您在服务器端应用程序中构建 HTML 以再次加载消息以进行进一步编辑时,您希望将字段的值进行 HTML 编码,因为您将该值放入 HTML 上下文中。您之前所做的是创建<textarea><tag> <b>bold text</b></textarea>
,即将 HTML 放入 HTML 上下文中。在基本上所有浏览器中,这使得 textarea 具有value <tag> <b>bold text</b>
。哎哟! (想象一下,如果有人将</textarea>
其作为原始信息的一部分!)
令所有人感到困惑的是,所见即所得的编辑器很不幸地擅长在那里显示您想要的内容。对于大多数用例,您甚至不会注意到差异,这就是此错误如此普遍的原因。
但是,在构建页面的 HTML 时,您实际上想要构建<textarea>&lt;tag&gt; <b>bold text</b></textarea>
. 这使得 textarea 具有价值 <tag> <b>bold text</b>
——这正是你想要的。
您当前拥有的解决方案将提交的文本运行通过htmlspecialchars_decode()
,变成<tag>
,<tag>
从而让 HTML Purifier 消除它。您不再需要担心<tag>
被解释为<tag>
所见即所得的上下文。
但是,不幸的是,您有两个问题:
1)人们不能在没有 HTML Purifier 剥离标签的情况下提交有关标签的消息。根据您的文本区域的用例,这可能不是问题。也许您不希望人们能够提交 HTML 消息,例如- 使用您当前的解决方案, HTML PurifierIf you're making your own website, you can use <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.2.6/jquery.js" language="javascript"> instead of hosting the jquery.js yourself
将处理这样的消息。If you're making your own website, you can use instead of hosting the jquery.js yourself
2) 更危险的是,人们仍然可以攻击你!尝试将文本 <script>alert(1);</script>
写入您的编辑器(以便编辑器看到您要提交的HTML&lt;script&gt;alert(1);&lt;/script&gt;
)并点击提交。您的解决方案将把它变成<script>alert(1);</script>
,您将把它放入您的<textarea>
,然后不幸的是您又回到了原点。
实际解决方案
删除您的htmlspecialchars_decode()
解决方案(但继续净化!),而不是htmlspecialchars()
围绕您的输出。您的所见即所得仍然可以工作,并且您不会再绕过 HTML Purifier 的卫生设施。