0

我有一个装满 3000 个邮件列表的记事本,但问题是除了空格和引号之外,我还需要删除重复的电子邮件,所以任何关于自动执行此操作的脚本的建议,而不是花费数小时来修复它谢谢

4

1 回答 1

0

聚会迟到了,但我修改了一个脚本来读取包含电子邮件的文件,并使用 RFC822 正则表达式、域错字列表、mx 查找(感谢 eagle1 此处)和模棱两可的电子邮件过滤对其进行过滤。

该脚本可以像这样使用:

./emailCheck.sh /path/to/emailList

并生成两个文件,过滤列表和模糊列表。两者都已从不符合 RFC822 的地址、没有有效 MX 域的电子邮件域和域拼写错误中清除。

然后,您可以使用以下方法删除重复项:

sort -u emaillist

脚本可以在这里找到:https ://github.com/deajan/linuxscripts

欢迎指正和评论:)

于 2016-03-30T11:47:13.880 回答