public String readEmails(String fileData) {
String regex = "[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9]"
+ "(?:[a-z0-9-]*[a-z0-9])?\\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?";
String emails = "", emails2 = "";
fileData = fileData.toLowerCase();
Matcher m = Pattern.compile(regex).matcher(fileData);
while (m.find()) {
emails += m.group()+", ";
}
return emails;
}
我正在阅读 rtf 文件,查找电子邮件,然后存储到数据库中。我发现一封电子邮件被提取了两次,即 HYPERLINK "mailto: aa@ymail.com" 然后是 aa@ymail.com
如何通过删除所有相似的电子邮件来匹配两封相似的电子邮件并保留一份副本?