所以我有一个数据框df,它基本上是一个 id 和坐标列表,我想从中得到距离矩阵。
代码运行良好,直到我创建了一个更大的df,大小为 (337644, 2)
注意:使用 64 位机器和 32GB RAM
df2是出现错误的距离矩阵
df = pd.DataFrame(list_coordinates_int, columns=['xcord', 'ycord'], index=list_id)
df2= pd.DataFrame(distance_matrix(df.values, df.values), index=df.index, columns=df.index)
我收到以下错误:
result = np.empty((m,n),dtype=float) # FIXME:找出最好的 dtype
ValueError:数组太大;arr.size * arr.dtype.itemsize
大于最大可能大小。
运行代码时我的 RAM 没有完全消耗,所以我不确定这里有什么问题。