0

是否有一个库,我可以在其中简单地调用字符串上的方法来确定它是否是非英语的?我试图只保存英文字符串,而传入的字符串流中有很多非英文字符串。

4

3 回答 3

2

您可以尝试使用linguo

"your string".lang
# will return "en" for english strings

免责声明:我是这颗宝石的创造者。

于 2012-04-04T16:03:19.553 回答
1

您可以使用带有 RailsBridge 的 GoogleTranslate API - http://code.google.com/apis/gdata/articles/gdata_on_rails.html

于 2012-04-04T15:43:52.730 回答
0

不是我知道...但是您可以将此列表放入一个数组(http://www.langmaker.com/wordlist/basiclex.htm),然后将字符串的单词与之匹配...确定某个百分比一样好,然后从那里开始。

您甚至可以在这里使用贝叶斯算法将这些词标记为“好”并从那里学习,但这可能有点矫枉过正。

于 2012-04-04T15:38:17.383 回答