输出或输入过滤?
我经常看到人们写“过滤你的输入”,“清理你的输入”,不信任用户数据,但我只同意最后一个,我认为信任任何外部数据都是一个坏主意,即使它是相对于内部的系统。
输入过滤: 我看到的最常见的。采取表单发布数据或任何其他外部信息源并在保存时定义一些边界,例如确保文本是文本,数字是数字,sql是有效的sql,html是有效的html并且它不包含有害标记,然后将“安全”数据保存在数据库中。
但是在获取数据时,您只需使用数据库中的原始数据。
在我个人看来,数据从来都不是真正安全的。虽然听起来很简单,但只需过滤从表单和 url 中获得的所有内容,实际上它比这要困难得多,它可能对一种语言安全,但对另一种语言则不然。
输出过滤: 这样做时,我将原始未更改的数据(无论它可能是什么)保存到数据库中,然后在访问数据时过滤掉有问题的代码,这有它自己的优势: 这在 html 之间增加了一层和服务器端脚本。 我认为这是各种数据访问分离。
现在数据根据上下文进行过滤,例如,我可以将数据库中的数据以纯转义文本、html 或任何地方的形式呈现在 html 文档中。
这里的缺点是您永远不要忘记添加过滤,这比输入过滤要难一些,并且在提供数据时会使用更多的 CPU。
这并不意味着您不需要进行验证检查,您仍然需要,只是您不保存过滤后的数据,您验证它并在数据因某种原因无效时向用户提供错误消息。
因此,与其“过滤你的输入”,不如说它应该是“验证你的输入,过滤你的输出”。
那么我应该使用“输入验证和过滤”还是“输入验证和输出过滤”?