0

我正在使用Lawrence Philips Double-Metaphone算法取得了巨大成功,但我发现某些组合出现了奇怪的“意外结果”。

是否有其他人对算法的其他部分进行了添加或更改,他们不介意共享,或者只是他们发现无法按预期工作的组合。

例如。我有以下问题:

  • 皮希尔和布什利。(均与 PXL 匹配)
  • 罗克利夫和罗克利夫(RKLF 和 RKKL)
4

2 回答 2

5

所有 Soundex、Metaphone 和变体方案有时会给出与您预期不同的结果。这是不可避免的——它们或多或少可以被视为具有特殊信息保留属性的简单哈希算法,有时会在您不希望它们不发生冲突时产生冲突,而当您不希望它们不这样做时有时会产生差异.

改进事物的一种可能方法是使用“同义词环”。这基本上产生了应该被视为同义词的单词列表,与拼写无关。我在名称匹配的上下文中遇到了它们。例如,Chaudri 的变体包括:

CHAUDARY CHAUDERI CHAUDERY CHAUDHARY CHAUDHERI CHAUDHERY CHAUDHRI CHAUDHRY乔杜里·乔杜里CHAUDHY绍德雷CHAUDRI乔德里CHAUDURI CHAWDHARY CHAWDHRY CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI CHOUDARY CHOUDERY CHOUDHARI CHOUDHARY CHOUDHERY CHOUDHOURY CHOUDHRI乔德里CHOUDHURI乔杜里CHOUDREY CHOUDRI CHOUDRY CHOUDURY CHOUWDHRY CHOWDARI CHOWDARY CHOWDHARY CHOWDHERY CHOWDHRI乔杜里CHOWDHURI CHOWDHURRYY乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里 乔杜里

于 2008-10-23T16:21:58.120 回答
-1

常规变音器正在返回 Peashill 和 Bushley 之间的差异

Peashill PXL 布什利 BXL

于 2008-12-12T22:47:56.780 回答