问题标签 [distance-matrix]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

146 问题

0 投票

2 回答

302 浏览

python - Python中基于字符串/整数序列的聚类和距离/相异矩阵

我有基于他在商店逗留的客户数据。店铺有4个区域；区域 1、2、3 和 4。现在每 2 分钟，我根据他所在的区域将他的读数设为 10 个数字。例如：

基本上，我希望有大部分客户都在特定区域中，并且他们会相应地聚集在一起。因此，在第一个序列中，客户似乎更喜欢 1 区，下一个 3 区，最后一个就像噪音一样。

我向程序提供的只是一堆序列（未标记）。如何生成一个距离/相异矩阵来计算 Python 中每个序列之间的距离？

2019-09-08T17:10:52.030

0 投票

1 回答

2357 浏览

python - 如何构建距离或相异矩阵？

我有一个 df 如下：

我正在计算每个字符串之间的距离。例如，要获得前 2 个字符串之间的距离：textdistance.hamming(df[0], df[1]). 这将返回一个整数。

现在，我想创建一个 df 来存储每个字符串之间的所有距离。在这种情况下，由于我有 1000 个字符串，我将有一个 1000 x 1000 df。第一个值是字符串 1 与自身之间的距离，然后是字符串 1 和字符串 2，依此类推。然后在下一行它的字符串 2 和字符串 1，字符串 2 和它本身等等。

python pandas distance-matrix

2019-09-09T04:06:02.063

0 投票

1 回答

382 浏览

r - 为什么距离矩阵 (dist()) 为具有超过 50 个观测值的数据集提供空值？

我有一个数据集，我正在计算它的距离矩阵。下面是数据，有 251 个观测值。

我标准化数据。

当我计算距离矩阵时，我可以看到很多空值，而且距离仅从 4 个观测值中测量。

对于剩余的 247 个比较，此列表为空。

现在，我将数据集减少到 20 个观察值

在这里，我得到了一个适当的距离矩阵。

当观察值为 21 时，输出中没有空值。

为什么会这样？当观察计数超过阈值时 dist() 是否不起作用？

我无法弄清楚。请帮忙。

r distance-matrix

2019-09-17T16:55:45.517

0 投票

0 回答

41 浏览

python - 识别一致点组

我在下面给出的列表 list1 和 list2 中有两组点

如果 list1 中的所有点都被旋转和/或平移，则点 a、b、c 和 d 分别与点 v、x、y 和 z 对齐。目前我已经编写了 Python 代码，它可以使用成对距离比较方法输出提供两个输入列表的成对组。它计算 list1 和 list2 内的列表内组合距离，并比较列表之间的这些距离以识别对。例如。距离（ab）〜=距离（vx），距离（ac）〜=距离（vy）等等。代码如下。我的代码有效，但对于较大的列表来说速度很慢。我想知道是否有更快或更简单的方法来解决这个问题。

谢谢

运行代码后，输出正确答案。输出大于 3 的组。

python math distance-matrix

2019-09-30T21:57:30.243

0 投票

1 回答

110 浏览