所以人们正在使用像这样的字符变体:(大约
有 100 个,哈哈)
⌀⟴øoΘθ0ºööó֎
来垃圾邮件种族主义/不允许的东西。
我使用正则表达式来应对这些事情,但我无法应对所有这些不同的变化。
有什么我可以做的吗?
也许是这些字符变体的预制列表,或者其他方式?
任何帮助表示赞赏,
谢谢。
您可以使用白名单来代替黑名单,只允许 az、AZ 和 0-9 之间的字符以及特殊字符,如 ,.^-?! ([a-zA-Z0-9.,;!*?\-^]+)
.
请参阅以下网址的匹配示例:http ://rubular.com/r/sUiLj2e1R1 。