1

许多技术可用于检测特定语言的垃圾邮件,如果采用适当的技术,可以使系统能够检测多种语言的垃圾邮件,但这需要单个文本为特定语言。

所以我的问题是如何检测由多种语言组成的文本?这不仅与语言检测有关。我想知道一些进行多语言文本垃圾邮件检测的最佳实践。

4

1 回答 1

0

一个幼稚的解决方案仍然是使用翻译 API 将文本按语言分割成片段。然后按语言对文本片段进行分类。

这是一个简单的解决方案,但我担心经常调用翻译 API 的性能。

我想知道大公司或一些优秀的项目如何处理这个问题?

于 2016-04-25T20:46:53.033 回答