使用正则表达式,我需要在完全呈现的 HTML 页面中查找并替换所有邮件地址,因为我想对它们进行垃圾邮件保护。准确地说,我想要除公式元素之外的所有地址(因为如果用户输入验证失败,我仍然想显示插入的邮件地址而不是替换的邮件地址)。
查找或编写正则表达式来简单地搜索邮件地址不是问题。问题是排除公式元素中的元素。有没有人建议如何解决这个问题?这在正则表达式中可能吗?
一些例子:我想匹配“......我的内容,mail@mail.com,更多内容......”但我不想匹配:“......你的邮件:mail@mail.com ……”
我知道解析 HTML 并简单地跳过表单元素会更好,但性能很重要,正如我之前所说,每次调用网站时都会执行此任务......
谢谢你的帮助!