0

处理用户提供的网址的最佳或最安全的方法是什么。我正在寻找人们社交媒体网站的网址;twitter、google+、facebook、youtube 等。我希望能够获取这些 url 并将它们存储在我的数据库中,而不会对数据库或网站造成风险。

我有哪些选择?我是否过滤输入和转义/排除字符,我是否只接受部分 url?

我仍然不确定安全过滤这些链接的最佳方法,我正在考虑一个系统,将用户提供的链接与一系列可接受的格式进行比较

IE。

我的 Facebook 链接是https://www.facebook.com/lilbugga,但我也可以使用https://www.facebook.com/532850510

马上就是 2 种不同的变体,然后人们也可以尝试使用 http、https、www、无 www 等提交指向他们个人资料的链接

如何处理所有这些不同的可能格式变化,是否创建一个数组,其中存储了多种不同格式的链接,以比较用户提供的字符串?

4

1 回答 1

2

URL 的最大风险不是它们包含的内容(您可以像进入系统的任何其他数据一样对其进行清理),而是它们的去向。您的担忧应该与通过导致恶意软件感染、网络钓鱼网站等的重定向发送您的用户有关。还要找到尽可能多地过滤垃圾邮件的方法 - 任何可以接受输入的暴露网页都将成为垃圾邮件发送者的保证目标,无论多么晦涩难懂,因此您需要在设计中考虑这一点。

您可能希望查看Google的 Safe Browsing API(我确信存在其他替代方案)之类的东西,作为在您将其上线之前识别潜在问题 URL 的一种方式。

于 2014-05-12T15:00:04.313 回答