我正在尝试用 Python 制作一个简单的电子邮件排名程序(类似于优先收件箱)。根据从发件人收到电子邮件的频率,例如有一个训练集,比如说 50%,其中计算发件人的频率,然后是一个 50% 的测试集,它根据训练按顺序排列(所以一封电子邮件来自发送大量消息的发件人排名很高)。
我编写了一些 Python 代码来接收电子邮件并从中提取“发件人”地址。我已将此信息放在一个列表中,该列表显示了最常见的电子邮件发件人(下面此列表中的示例片段)。
//(Email address, frequency of emails received from this sender)//Not Code
('tester1@csmining.org', 244)
('tester2@csmining.org', 162)
('tester3@csmining.org', 154)
('tester4@csmining.org', 75)
('tester5@csmining.org', 50)
我知道可以有效地使用许多机器学习算法来训练和测试我的数据以完成我需要的工作。但是,我不确定我可以使用其中哪些来给我最好的结果?