问题标签 [html-sanitizing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1719 浏览

ruby - Rails HTML 清理

我正在尝试清理 HTML 文件,但它无法正常工作。除了段落和换行标记之外,我希望全部都是纯文本。这是我的清理代码(点表示我班级中与问题无关的其他代码):

它无法正常工作。 这是函数从中读取其输入的原始 HTML 文件,这是它返回的“净化”代码。它留在 CSS 标记、JavaScript 和 HTML 注释标记的正文中。它也可能会留在我没有注意到的其他东西中。请告知如何彻底删除除段落和换行标记之外的所有 CSS、HTML 和 JavaScript?

0 投票
1 回答
143 浏览

security - 用户在没有脚本标签的浏览器中可以做哪些坏事?

我有一个输入表单,用户可以在其中输入任意 HTML。除了脚本标签,我还需要过滤什么?这就是我所做的:

但是WMD 的消毒剂(在 SO 上使用)管理标签的白名单,并过滤掉(空白)所有其他标签。为什么?

我不喜欢白名单,因为我不想阻止用户输入任意标签,如果她愿意的话;但如果需要,除了“脚本”之外,我还可以使用更广泛的黑名单。我需要什么作为黑名单?

0 投票
2 回答
326 浏览

c# - 是否存在与 Web 保护库 (Anti-XSS) 等效的最低信任?

我正在开发一个需要对 HTML 进行清理的项目。通常,我会求助于Microsoft Web Protection Library;但是,在这种情况下,我正在开发一个以最低信任度运行的应用程序。WPL 的一部分需要中等信任,其余的似乎需要完全信任。

任何人都可以推荐一个可以在最小信任环境中运行的好的 HTML sanitizer 吗?

0 投票
1 回答
1124 浏览

php - PHP htmlspecialchars 函数中的 Unicode 替换字符

在 htmlspecialchars 函数中,如果设置了 ENT_SUBSTITUTE 标志,它应该替换一些无效字符。

什么字符被替换?无效字符与用于替换它的字符之间的映射是什么?

0 投票
3 回答
5805 浏览

regex - Java 正则表达式