我正在处理一个接受不同语言的用户输入的应用程序(目前已修复 3 种语言)。要求是用户可以输入文本,而不必费心通过 UI 中提供的复选框来选择语言。
是否有现有的 Java 库来检测文本的语言?
我想要这样的东西:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
结果:
EN
我不想知道如何自己创建语言检测器(我已经看到很多博客试图这样做)。该库应该提供一个简单的 API,并且可以完全离线工作。开源或商业封闭无关紧要。
我还在 SO(以及更多)上发现了这个问题: