问题标签 [k-means]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3202 浏览

matlab - MATLAB:绘制质心

我的主要问题是给定一个特征质心,如何在 MATLAB 中绘制它?

更详细地说,我有一个NxNx3图像(RGB 图像),我获取块并为每个块4x4计算一个维特征向量。6我将这些特征向量存储在一个Mx6矩阵中,在该矩阵上运行kmeans函数并获得kx6矩阵中的质心,其中k是簇6数,是每个块的特征数。

如何在我的图像中绘制这些中心簇,以便可视化算法是否按照我希望的方式执行?或者,如果有人对如何可视化图像上的质心有任何其他方式/建议,我将不胜感激。

0 投票
2 回答
4471 浏览

algorithm - 如何计算此聚类中总误差的度量

这是关于k-means聚类算法的问题。我有以下几点和数据S1的聚类。谁能告诉我如何计算与此聚类相关的总误差?我知道这不是一个严格的编程问题,但我的算法需要它。我认为答案应该是 4/3,但我不知道如何计算。谁能帮我?

0 投票
1 回答
1759 浏览

c# - 数据聚类方法

我正在用 C# 编写一个程序,其中我在图像上显示了一组 200 个点。但是,这些点倾向于聚集在各个区域,我正在寻找一种“聚集”的方法。换句话说,可以在聚集点周围画一个圆/椭圆。

有没有人看到任何方法来做到这一点?我听说过 K-means 聚类,但我不确定如何在 C# 中实现它。

有什么最喜欢的实现吗?

0 投票
1 回答
1068 浏览

r - 使用 R 中 bigmemory 包中的 bigkmeans 进行聚类?

我最近开始尝试使用 R 的 biganalytics 包。但是我遇到了一个问题......

我正在尝试以bigkmeans大约 2000 的集群数运行,例如clust <- bigkmeans(mymatrix, centers=2000)

但是,我收到以下错误:
Error in 1:(10 + 2^k) : result would be too long a vector

有人可以给我一个提示我在这里做错了什么吗?

0 投票
3 回答
3389 浏览

matrix - 在非常大的稀疏矩阵上聚类?

我正在尝试在一个非常大的矩阵上进行一些(k-means)聚类。

该矩阵大约有 500000 行 x 4000 列,但非常稀疏(每行只有几个“1”值)。我想获得大约 2000 个集群。

我有两个问题: - 有人可以推荐一个开源平台或工具来做到这一点(也许使用 k-means,也许有更好的东西)?- 我怎样才能最好地估计算法需要完成的时间?我尝试过一次 weka,但几天后就放弃了这项工作,因为我不知道需要多少时间。

谢谢!

0 投票
1 回答
1783 浏览

image - 图像相似度和 k-mean 聚类

我正在玩一些图像相似性。事实上,我正在玩图像检索系统。理想情况下,我想创建某种图像索引,我可以查询以获取类似图像。

我目前的想法是将某种 ImageDescriptor 存储到索引中,每个描述符可以有不同的特征,例如 k-mean-cluster-centroids,直方图,......而且我有一些简单的基于 wight 的计算 - 每个特征都有距离函数并且该函数的结果乘以它的 wight 并在所有特征中求和。最终总和是与我的形象的距离。不确定这是不是很好的思路?

所以我开始玩直方图。我存储了直方图的索引,而不是查询直方图和索引存储的直方图之间的距离。它提供了某种相似性,但在大多数情况下远非理想。

现在我正在玩 k-mean 聚类。我已经实现了基于 RGB 距离的分割(也将在 Lab 颜色模式下尝试)。我的索引由质心向量(来自聚类)组成。现在我正在做质心之间的最小距离比较。它给出了更好的结果,但也远非好。

我的第一个问题是我可以对段(集群)做一些比查询距离更好的事情吗?如何包含形状信息?

正如旁注一样,大多数图像是日常物品的图像(不同的铅笔、不同的眼镜、不同的鞋子……),并且在相同颜色的背景上具有不同的纹理。没有自然图像、面孔、树木、云彩、山脉……

问候扎哈里杰

0 投票
1 回答
756 浏览

c# - 在数据库存储的信息上实现复杂的算法

我试图找出在关系数据库中存储信息的复杂算法的最佳实践。

具体来说:我想在包含许多文档的 TFxIDF 向量的大型 MS SQL Server 数据库上实现 k-means 算法(文档聚类算法)的变体(这些向量用作算法的输入)。

我的第一个想法是使用存储过程、函数、视图和所有其他基本 SQL Server 工具在 SQL 中完成所有工作,但后来我想也许我应该编写托管代码(我精通 C#),这些代码将在SQL 服务器。

性能是这里的一个问题,所以我也需要考虑到这一点。

我将不胜感激有关我应该采取的道路的任何建议。

谢谢!

0 投票
5 回答
33007 浏览

matlab - 如何对时间序列数据执行 K-means 聚类?

如何对时间序列数据进行 K 均值聚类?我理解当输入数据是一组点时这是如何工作的,但我不知道如何用 1XM 对时间序列进行聚类,其中 M 是数据长度。特别是,我不确定如何更新时间序列数据的集群平均值。

我有一组带标签的时间序列,我想使用 K-means 算法来检查我是否会得到类似的标签。我的 X 矩阵将是 NXM,其中 N 是时间序列的数量,M 是如上所述的数据长度。

有谁知道如何做到这一点?例如,我如何修改这个 k-means MATLAB 代码,使其适用于时间序列数据?此外,我希望能够使用除欧几里得距离之外的不同距离度量。

为了更好地说明我的疑问,这是我为时间序列数据修改的代码:


0 投票
5 回答
7754 浏览

matlab - MATLAB kMeans 并不总是收敛到全局最小值

我在 MATLAB 中编写了一个k-Means 聚类算法,我想我会针对内置的 MATLAB 进行尝试kmeans(X,k)

然而,对于非常简单的四集群设置(见图),MATLAB kMeans并不总是收敛到最优解(左),而是收敛到(右)。

我写的也不总是那样做,但是内置函数不应该能够解决这样一个简单的问题,总是找到最佳解决方案吗?

替代文字

0 投票
1 回答
17804 浏览

cluster-analysis - 在线 k-means 聚类

是否有在线版本的k-Means 聚类算法?

在线我的意思是每个数据点都是串行处理的,当它们进入系统时一次一个,因此在实时使用时可以节省计算时间。

我自己写了一篇效果很好的文章,但我真的更希望有一些“标准化”的东西可以参考,因为它会在我的硕士论文中使用。

另外,有人对其他在线聚类算法有建议吗?(lmgtfy 失败 ;))