0

我正在寻找任何可以帮助将两个单词与拼写错误匹配的库。例如,gem 应该将以下语句标记为 true(这只是一个示例,不需要扩展标准字符串)

'Start' == 'Strat'
'woodpecker' == 'Wodpekcer'

任何用于数据质量检查的红宝石宝石?

4

2 回答 2

2

正如您所说,您正在寻找库/宝石,这里有一些实现字符串距离和模糊匹配的宝石:

这些库不扩展核心类,因此您将无法使用==运算符比较字符串,但您可以计算它们的相似性并找到相似的字符串。

对于 Soundex、Metaphone 等,您可以使用美妙的文本 gem。它可能更多地涉及使用语音算法,因为它们可能会更好或更差,具体取决于语言。对英语完美适用的东西可能不适用于其他语言。

于 2013-12-20T14:18:02.593 回答
0

你知道莱文斯坦吗?

https://github.com/anjlab/rubyfish只是一个可以安装的 gem

于 2013-12-20T14:18:04.433 回答