17

例如,Soundex 算法针对英语进行了优化。是否有更通用的算法适用于大型语言系列?

4

1 回答 1

16

SOUNDEX 确实是面向英语的。考虑到更广泛的语音差异的另外两个是:Double MetaphoneNYSIIS

它们将编码生成到比 SOUNDEX 更大的可能空间中。Double Metaphone,具体来说,包括减少处理基于比英语更多的语言的替代发音的明确目的。

我最近做了一个关于模糊字符串匹配的演示,这些幻灯片可能会有所帮助。

于 2008-09-24T15:51:59.097 回答