我运行一个基于 Django 的论坛(该框架可能对这个问题并不重要,但仍然如此)并且它越来越多地收到不断链接到特定网站的帖子(www.solidwoodkitchen.co.uk - 这些人显然是最差的)。
我已经实现了一个字符串阻止系统,如果帖子中包含网站的 URL,它会阻止他们在论坛上发帖,但正如垃圾邮件机器人通常所做的那样,它已经通过将 URL 与其他字符分解来找到解决方法(例如 w_w_w.s*olid_wood*kit_ch*en._*co.*uk 。)。所以有几个问题:
- 是否有可能构建一个能够在文本块中找到特定 URL 的正则表达式,即使它已被这样修改?
- 如果是,这会导致性能下降吗?