我有一个装满 3000 个邮件列表的记事本,但问题是除了空格和引号之外,我还需要删除重复的电子邮件,所以任何关于自动执行此操作的脚本的建议,而不是花费数小时来修复它谢谢
问问题
77 次
1 回答
0
聚会迟到了,但我修改了一个脚本来读取包含电子邮件的文件,并使用 RFC822 正则表达式、域错字列表、mx 查找(感谢 eagle1 此处)和模棱两可的电子邮件过滤对其进行过滤。
该脚本可以像这样使用:
./emailCheck.sh /path/to/emailList
并生成两个文件,过滤列表和模糊列表。两者都已从不符合 RFC822 的地址、没有有效 MX 域的电子邮件域和域拼写错误中清除。
然后,您可以使用以下方法删除重复项:
sort -u emaillist
脚本可以在这里找到:https ://github.com/deajan/linuxscripts
欢迎指正和评论:)
于 2016-03-30T11:47:13.880 回答