是否有一个库,我可以在其中简单地调用字符串上的方法来确定它是否是非英语的?我试图只保存英文字符串,而传入的字符串流中有很多非英文字符串。
问问题
1494 次
3 回答
2
于 2012-04-04T16:03:19.553 回答
1
您可以使用带有 RailsBridge 的 GoogleTranslate API - http://code.google.com/apis/gdata/articles/gdata_on_rails.html
于 2012-04-04T15:43:52.730 回答
0
不是我知道...但是您可以将此列表放入一个数组(http://www.langmaker.com/wordlist/basiclex.htm),然后将字符串的单词与之匹配...确定某个百分比一样好,然后从那里开始。
您甚至可以在这里使用贝叶斯算法将这些词标记为“好”并从那里学习,但这可能有点矫枉过正。
于 2012-04-04T15:38:17.383 回答