我知道如果用户需要提供 HTML 代码作为表单输入的一部分(例如在 textarea 中),那么我会使用 Anti-Samy 策略来过滤掉不允许的危险 HTML。
但是,我有一些文本字段和文本区域应该是纯文本的。根本不应该从这些字段将 HTML 代码插入到数据库中。
因此,我正在尝试清理输入,以便仅将原始文本插入数据库。我相信我可以通过两种方式做到这一点:
- 使用正则表达式过滤掉 HTML 代码,例如
#REReplaceNoCase(FORM.InputField, "[^a-zA-Z\d\s:]", "", "ALL")#
- 使用严格的纯文本 Anti-Samy 政策
哪个选项是从文本字段中删除任何用户输入的 HTML 代码的正确/良好实践方法。或者我还有其他选择吗?