我有两个列表,下面,我想比较相似的 levenshtein 距离是否小于 2。我有一个函数来查找 levenshtein 距离,但是作为参数,它需要这两个词。我可以找到其他列表中没有的单词,但这没有帮助。而且我可以按索引进行索引,但是如下例所示,当我到达索引 7(但除此之外)时,一切都被抛弃了,因为不忠将是索引 9 和 8,而 wcop88 是 9 和 10,因此这些不会被比较。有没有办法说如果不忠的一部分在另一个列表中的某个单词中,然后检查这两个,请注意这并不总是有效,因为说如果不忠和不忠只有 in 和 ty 可以匹配,很多词可以可能匹配
[u'rt', u'cuaimatizada', u's', u'cuaimaqueserespeta', u'forgives', u'any', u'mistake', u'but', u'the', u'infidelity', u'wocp88']
[u'rt', u'cuiamatizada', u's', u'cuimaqueserespeta', u'forgive', u'any', u'mistake', u'except', u'infedelity', u'wcop88']
编辑:所以我的目标是能够为我的 levenshtein 函数提供需要检查的两个单词。在这种情况下,以下对:
u'cuaimatizada u'cuiamatizada
u'cuaimaqueserespeta u'cuimaqueserespeta
u'forgives u'forgive
u'infedelity u'infidelity
u'wocp88 u'wcop88
我不知道手头有哪些话。