问题标签 [distance-matrix]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
302 浏览

python - Python中基于字符串/整数序列的聚类和距离/相异矩阵

我有基于他在商店逗留的客户数据。店铺有4个区域;区域 1、2、3 和 4。现在每 2 分钟,我根据他所在的区域将他的读数设为 10 个数字。例如:

基本上,我希望有大部分客户都在特定区域中,并且他们会相应地聚集在一起。因此,在第一个序列中,客户似乎更喜欢 1 区,下一个 3 区,最后一个就像噪音一样。

我向程序提供的只是一堆序列(未标记)。如何生成一个距离/相异矩阵来计算 Python 中每个序列之间的距离?

0 投票
1 回答
2357 浏览

python - 如何构建距离或相异矩阵?

我有一个 df 如下:

我正在计算每个字符串之间的距离。例如,要获得前 2 个字符串之间的距离:textdistance.hamming(df[0], df[1]). 这将返回一个整数。

现在,我想创建一个 df 来存储每个字符串之间的所有距离。在这种情况下,由于我有 1000 个字符串,我将有一个 1000 x 1000 df。第一个值是字符串 1 与自身之间的距离,然后是字符串 1 和字符串 2,依此类推。然后在下一行它的字符串 2 和字符串 1,字符串 2 和它本身等等。

0 投票
1 回答
382 浏览

r - 为什么距离矩阵 (dist()) 为具有超过 50 个观测值的数据集提供空值?

我有一个数据集,我正在计算它的距离矩阵。下面是数据,有 251 个观测值。

我标准化数据。

当我计算距离矩阵时,我可以看到很多空值,而且距离仅从 4 个观测值中测量。

对于剩余的 247 个比较,此列表为空。

现在,我将数据集减少到 20 个观察值

在这里,我得到了一个适当的距离矩阵。

当观察值为 21 时,输出中没有空值。

为什么会这样?当观察计数超过阈值时 dist() 是否不起作用?

我无法弄清楚。请帮忙。

0 投票
0 回答
41 浏览

python - 识别一致点组

我在下面给出的列表 list1 和 list2 中有两组点

如果 list1 中的所有点都被旋转和/或平移,则点 a、b、c 和 d 分别与点 v、x、y 和 z 对齐。目前我已经编写了 Python 代码,它可以使用成对距离比较方法输出提供两个输入列表的成对组。它计算 list1 和 list2 内的列表内组合距离,并比较列表之间的这些距离以识别对。例如。距离(ab)〜=距离(vx),距离(ac)〜=距离(vy)等等。代码如下。我的代码有效,但对于较大的列表来说速度很慢。我想知道是否有更快或更简单的方法来解决这个问题。

谢谢

运行代码后,输出正确答案。输出大于 3 的组。

0 投票
1 回答
110 浏览

reactjs - 回调函数的返回值

我在通过回调函数(“dist”= undefined)获取返回值时遇到了一些麻烦......我已经尝试了很多次但仍然未定义。但是,我可以从控制台获取它....请一些机构可以提供帮助!

0 投票
1 回答
538 浏览

python - 从距离矩阵数据框中找到最小值的成对标签

我有一个scipy distance_matrix作为dataframe.

如何从数据框中提取每行的最小值(不包括 0.00)以及该值的关联(行、列)标签?

例如:

第一min行的将是[0.012885,'king','boy']

第二min行的将是[2.826742,'wise','bananas']

代码DataFrame

输出:

我已经尝试了以下(仍然需要附加关联的值):

出去:

0 投票
2 回答
1880 浏览

python - Python:为大量位置生成距离矩阵

我想使用Haversine公式根据500个位置的纬度和经度生成距离矩阵500X500。

以下是 10 个位置的示例数据“coordinate.csv”:

得到距离矩阵后,我想根据距离矩阵找到离每个客户最近的仓库,然后将输出(从每个客户到壁橱仓库的距离和最近仓库的名称)保存到 Pandas DataFrame。

预期产出:

0 投票
1 回答
400 浏览

r - 读取上三角距离矩阵并在 R 中生成树状图

我的问题(今天)如下:

我在文本格式的文件(“dist.dis”)中有一个上对角线距离矩阵(由第三方程序生成),我想将其读入 R 以计算聚类分析并生成树状图:

在一个单独的文本文件(“dist.nam”)中,我还有一个对象名称列表,其中计算了距离:

这是我的 R 代码,用于读取上述矩阵并生成树状图:

此代码有效,并生成以下树状图:

在此处输入图像描述

但是,我想在树状图的尖端显示对象的名称(而不是它们的编号)。为此,我尝试了以下代码:

但后来我得到了一个可怕的错误:“if (is.na(n) || n > 65536L) stop("size cannot be NA or超过 65536") 中的错误:需要 TRUE/FALSE 的缺失值”。

有人可以帮帮我吗?

0 投票
0 回答
37 浏览

python-3.x - 使用稀疏矩阵代替 numpy 距离矩阵

我有一个汽车 ID 列表和一个 x,y 坐标列表。我想计算每个坐标之间的距离。

问题是,在尝试了数周之后,距离矩阵有限制,我正在处理由数百万行和列组成的矩阵的千兆文件。这可以使用稀疏来完成以使其更有效吗?

产生的df2是这样的:

有没有办法我可以使用稀疏或任何其他方法而不是距离矩阵来获得相同的 df2?

0 投票
1 回答
1281 浏览

python - 自定义距离的距离矩阵

据我了解,scipy 函数scipy.spatial.distance_matrix从提供的向量矩阵返回任何一对向量的 Minkowski 距离。有没有办法在不同的距离下获得相同的结果?看起来像distance_matrix(X, Y, distance_function)什么?

我假设 scipy 在幕后做了某种优化。由于我正在处理非常大的向量,因此我宁愿通过实现自己的 distance_matrix 函数来失去这些优化的好处。