我有如下用户交易数据:
email_id
ayush.jain@gmail.com
a.yushjain@gmail.com
ay.ushjain@gmail.com
ayus.hjain@gmail.com
ayush.jain1@gmail.com
ayush.jain+1@gmail.com
ayush.jain+3@gmail.com
praneet.parekh@gmail.com
pra.neet.parekh@gmail.com
praneet.parekh+10@gmail.com
p.raneet.parekh@gmail.com
这是一个大数据集,这里我只展示了 2 个欺诈用户的例子。我想捕获这些类型的电子邮件。我想到使用序列聚类。有人知道可以在 python-3.x 中实现的任何此类算法吗?