我正在学习各种电子邮件服务提供商实施的垃圾邮件过滤技术。准确地说,这被视为一个分类问题,并使用各种技术,如贝叶斯、SVM(支持向量机)、KNN 等来创建分类模型。
在这些方法之前,我了解了一切。但是当我看到 Gmail 中的用户自定义垃圾邮件过滤时,我有点困惑(我们可以选择任何邮件作为垃圾邮件或非垃圾邮件)。他们究竟是如何实现这个选项的。他们会为每个用户创建一个单独的分类模型,还是有任何其他选项/技术可以做到这一点。
我试图在网上搜索它,但没有得到满意的结果。
我正在学习各种电子邮件服务提供商实施的垃圾邮件过滤技术。准确地说,这被视为一个分类问题,并使用各种技术,如贝叶斯、SVM(支持向量机)、KNN 等来创建分类模型。
在这些方法之前,我了解了一切。但是当我看到 Gmail 中的用户自定义垃圾邮件过滤时,我有点困惑(我们可以选择任何邮件作为垃圾邮件或非垃圾邮件)。他们究竟是如何实现这个选项的。他们会为每个用户创建一个单独的分类模型,还是有任何其他选项/技术可以做到这一点。
我试图在网上搜索它,但没有得到满意的结果。
Different people has different preference thus we indeed need separate classification model for each user. For the sake of efficience, we divide users to several groups which have different models. The most challenging thing is data collecting. The data is often incomplete, error prone and not accessible