我正在寻找一个库或技术来检测用户提供的文本块的输入语言。在线查找(如谷歌翻译)不适用于此任务,因为我正在编写一个必须离线运行的应用程序。
谢谢。
我正在寻找一个库或技术来检测用户提供的文本块的输入语言。在线查找(如谷歌翻译)不适用于此任务,因为我正在编写一个必须离线运行的应用程序。
谢谢。
这里还有两个您可能想尝试的基于n-gram的 gem。他们离线工作。
对于任何感兴趣的人,我发现http://rubygems.org/gems/kenwaln-whatlanguage表现出色。
我正在使用我非常喜欢的CLD,简洁且易于使用。试试看。
Ruby 中 WhatLanguage 的快速演示:
http://www.youtube.com/watch?v=lNqZ2cqOReo&list=UUJ_3fstMOH-g4yBxtvgAWkw&index=0&feature=plcp