0

使用正则表达式,我需要在完全呈现的 HTML 页面中查找并替换所有邮件地址,因为我想对它们进行垃圾邮件保护。准确地说,我想要除公式元素之外的所有地址(因为如果用户输入验证失败,我仍然想显示插入的邮件地址而不是替换的邮件地址)。

查找或编写正则表达式来简单地搜索邮件地址不是问题。问题是排除公式元素中的元素。有没有人建议如何解决这个问题?这在正则表达式中可能吗?

一些例子:我想匹配“......我的内容,mail@mail.com,更多内容......”但我不想匹配:“......你的邮件:mail@mail.com ……”

我知道解析 HTML 并简单地跳过表单元素会更好,但性能很重要,正如我之前所说,每次调用网站时都会执行此任务......

谢谢你的帮助!

4

1 回答 1

0

这可能是不可能的。请参阅:RegEx 匹配除了 XHTML 自包含标签以外的开放标签。第二个正则表达式在“不”方面做得不好。(有些正则表达式支持它,有些不支持,但都慢了。)也许比我更擅长正则表达式的人可以帮助你,但我怀疑这样做是不可能的。

于 2012-08-27T09:06:16.430 回答