1

我试图从一些有序列表中获取数字,例如一个列表可能是“ABCD E”,另一个:“CBEADHGFIJ K”

所以我有一些受信任的数据,这是一组有序列表,每个列表都与一个字符串相关联,我正在尝试评估哪种自动化方式最适合检索给定字符串的相同列表,以便列表匹配(或作为尽可能类似于)我的受信任数据中相同字符串的列表。

我没有强大的统计学背景,我希望您可以参考我可以使用的方法以及可以帮助我理解如何实现它们的链接或资源。

4

1 回答 1

1

解决方案将取决于您的相似性概念。一种流行的相似性度量是Levenshtein 距离(从另一个字符串获取一个字符串所需的字母添加、删除和修改的数量)。

于 2012-05-19T07:20:19.813 回答