我有这样的数据框:
apple aple apply
apple 0 0 0
aple 0 0 0
apply 0 0 0
我想计算字符串距离,例如 apple -> aple 等。我的最终结果在这里:
apple aple apply
apple 0 32 14
aple 32 0 30
apply 14 30 0
目前这是我正在使用的代码(但对于大数据来说非常慢):
columns = df.columns
for r in columns:
for c in columns:
m[r][c] = Simhash(r).distance(Simhash(c))
谁能帮我有效地计算距离?