是否有一个库,我可以在其中简单地调用字符串上的方法来确定它是否是非英语的?我试图只保存英文字符串,而传入的字符串流中有很多非英文字符串。
			
			1494 次
		
3 回答
            2        
        
		
于 2012-04-04T16:03:19.553   回答
    
    
            1        
        
		
您可以使用带有 RailsBridge 的 GoogleTranslate API - http://code.google.com/apis/gdata/articles/gdata_on_rails.html
于 2012-04-04T15:43:52.730   回答
    
    
            0        
        
		
不是我知道...但是您可以将此列表放入一个数组(http://www.langmaker.com/wordlist/basiclex.htm),然后将字符串的单词与之匹配...确定某个百分比一样好,然后从那里开始。
您甚至可以在这里使用贝叶斯算法将这些词标记为“好”并从那里学习,但这可能有点矫枉过正。
于 2012-04-04T15:38:17.383   回答