Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
许多技术可用于检测特定语言的垃圾邮件,如果采用适当的技术,可以使系统能够检测多种语言的垃圾邮件,但这需要单个文本为特定语言。
所以我的问题是如何检测由多种语言组成的文本?这不仅与语言检测有关。我想知道一些进行多语言文本垃圾邮件检测的最佳实践。
一个幼稚的解决方案仍然是使用翻译 API 将文本按语言分割成片段。然后按语言对文本片段进行分类。
这是一个简单的解决方案,但我担心经常调用翻译 API 的性能。
我想知道大公司或一些优秀的项目如何处理这个问题?