1

我有基于他在商店逗留的客户数据。店铺有4个区域;区域 1、2、3 和 4。现在每 2 分钟,我根据他所在的区域将他的读数设为 10 个数字。例如:

1-1-1-1-1-1-1-1-3-3-2
4-4-3-3-3-3-3-2-1-3-3
3-4-1-2-2-3-1-4-2-1-4

基本上,我希望有大部分客户都在特定区域中,并且他们会相应地聚集在一起。因此,在第一个序列中,客户似乎更喜欢 1 区,下一个 3 区,最后一个就像噪音一样。

我向程序提供的只是一堆序列(未标记)。如何生成一个距离/相异矩阵来计算 Python 中每个序列之间的距离?

4

2 回答 2

0

经过一番挖掘,我遇到了python中的textdistance库。

https://pypi.org/project/textdistance/

即使我的输入是整数序列,它似乎也能很好地解决这个问题。

于 2019-09-09T03:43:29.567 回答
0

您可以使用余弦或欧几里得距离来计算距离。

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.cosine.html

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.euclidean_distances.html
于 2019-09-09T03:55:00.707 回答