有一个带有dict
元素的列的 SFrame。
import graphlab
import numpy as np
a = graphlab.SFrame({'col1':[{'oshan':3,'modi':4},{'ravi':1,'kishan':5}],
'col2':[{'oshan':1,'rawat':2},{'hari':3,'kishan':4}]})
我想为cosine
SFrame 的每一行计算这两列之间的距离。下面是使用for loop
.
dis = np.zeros(len(a),dtype = float)
for i in range(len(a)):
dis[i] = graphlab.distances.cosine(a['col1'][i],a['col2'][i])
a['distance12'] = dis
这是非常低效的,如果行数很大,则需要数小时。有人可以建议一个更好的方法。