我使用 google-diff-match-patch C# 库。我想测量两个文本之间的相似性。为此,我制作了这个 C# 代码:
List<DiffMatchPatch.Diff> lDiffs = dmpDiff.diff_main(sTexte1, sTexte2);
int iIndex = dmpDiff.diff_levenshtein(lDiffs);
double dsimilarity = 100 - ((double)iIndex / Math.Max(sTexte1.Length, sTexte2.Length) * 100);
相似度值介于 0 - 100 之间(0 == 完美匹配 - 100 == 完全不同)。
你认为这是一个好方法吗,这个计算是正确的吗?