我试图找到一些可以测试字符串“发音”的东西,尽管我实际上怀疑是否有任何东西可以免费获得。
发现微软有一个库,我实际上有点惊讶。 http://msdn.microsoft.com/en-us/library/ms718902(VS.85).aspx
这让我开始思考,也许它确实存在于其他地方,或者也许有一些合理的 soundex+foo 组合,我可以将它们组合在一起,这将奖励 BOOL 或“% RATING”,这可能有助于我确定生成的字符串是否是发音。
你会如何解决这个问题?难度:在 LAMP 系统上实现(我希望我的网络服务器自动对单词的 PINDEX 进行分类)。
编辑:oo...发现了一些更酷的链接。凉爽的!:)
http://www.addedbytes.com/code/flesch-kincaid-function/
如何检查一个字符串是否看起来是随机的,或者是人为生成的和发音的?
编辑2:
天啊!有一个可用的谷歌代码项目:
http://code.google.com/p/php-text-statistics/
如果我确实设法让它工作,我一定会跟进一个简短的教程。