我有一个字符串列表,其中一些自我之前的版本以来已被修改。一些变化是微不足道的(间距,一个字等)。我想检测只有“微小”差异的字符串,以便尽可能尝试使用较旧的翻译。
我所说的“细微差别”是什么意思?在我开始使用数据库之前我不会知道。
您是否知道任何可以指示两个字符串何时相似但不相同的可调例程?任何将返回一个数字的例程,指示两个字符串的不同之处?
有很多这样的算法。关键字是模糊字符串匹配。
一个众所周知的是Levenshtein distance。通过它,您可以计算将一个字符串转换为另一个字符串所需的“更改”次数,以便您估计字符串的相似程度。
另请参阅此问题:如何在 Delphi 中搜索解决方案的相似词。