基于这篇论文: IEEE TRANSACTIONS ON PAITERN ANALYSIS : Computation of Normalized Edit Distance and Applications 在本文中 Normalized Edit Distance如下:
给定有限字母表上的两个字符串 X 和 Y,X 和 Y 之间的归一化编辑距离 d( X , Y ) 定义为 W( P ) / L ( P )w 的最小值,这里 P 是之间的编辑路径X 和 Y ,W ( P ) 是 P 的基本编辑操作的权重之和,L(P) 是这些操作的数量(P 的长度)。
我可以安全地将上面解释的归一化编辑距离算法翻译为:
normalized edit distance =
levenshtein(query 1, query 2)/max(length(query 1), length(query 2))