我有一个字符串列表,我想根据列文斯坦距离过滤掉过于相似的字符串。所以如果lev(list[0], list[10]) < 50
; 然后del list[10]
。有什么方法可以更有效地计算列表中每对字符串之间的距离吗?谢谢!!
data2= []
for i in data:
for index, j in enumerate(data):
s = levenshtein(i, j)
if s < 50:
del data[index]
data2.append(i)
上面相当愚蠢的代码计算时间太长了......