问题标签 [spherical-kmeans]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
939 浏览

opencv - opencv:如何使用kmeans()按角度聚类

问题是,如何通过角度对某些单元进行聚类?问题是,kmeans 在欧几里得空间距离的概念上运行,不知道角度的周期性。因此,要使其工作,需要将角度转换为欧几里得空间,但要满足以下条件:

  1. 近角是欧几里得空间中的近值;
  2. 远角在欧几里得空间中很远。

这意味着,90 和 -90 是遥远的值,180 和 -180 是相同的,170 和 -170 是接近的(角度从左上到右:0 - +180,从左下到右:0 - -180)

我尝试使用各种sin()函数,但它们都存在第 1 点和第 2 点中提到的问题。大多数观点之一是sin(x * 0.5f)但也有问题,即 180 和 -180 在欧几里得空间中是遥远的值。

0 投票
0 回答
259 浏览

r - skmeans不在r中产生轮廓图

我用 skmeans 对大型数据集(~1m 观察和~200 个特征)进行了聚类,我想验证结果。问题是,根据教程,skmeans 生成适合轮廓计算的对象,但是如果我按照教程进行操作,我会收到错误消息。有人可以解释这个错误来自哪里吗?两个对象属于同一类,但绘图适用于派对,但不在我的集群上。

0 投票
1 回答
395 浏览

algorithm - k=2 的 Kmeans 算法给出相等的簇大小输出

我正在使用修改后的劳埃德算法在 k=2 的 kmeans 中获得相等的集群大小输出。以下是伪代码:

现在,上述算法在经验上对我来说效果很好:

  1. 它提供了平衡的集群
  2. 它总是降低目标

以前有文献提出或分析过这样的算法吗?请问我可以得到一些参考吗?

0 投票
1 回答
213 浏览

machine-learning - K-Means++ 算法——解释下一个聚类中心的选择

在此处输入图像描述

就像图片一样,为什么不直接选择点2作为聚类的第二个点呢?而是去生成一个[0,1]之间的随机数呢?

为什么要生成 r 来与 p 进行比较(图中的累积概率是 Sum)?

0 投票
1 回答
117 浏览

python - tensorflow kmeans 似乎没有采用新的初始点

通过在 Tensorflow 上获得与许多 k 均值试验的平均距离最低的结果,我正在我的数据中找到最佳集群集。

但是我的代码不会在每次试验中更新初始质心,因此所有结果都是相同的。

这是我的代码 1 - tensor_kmeans.py

这是code1之外的代码。

我在哪里可以找到问题?我在等你的答复,谢谢。

0 投票
1 回答
31 浏览

neo4j - 根据客户意见创建产品集群

我有 100 万行是这样的:

customer_id product_id_viewed 12345 [756436, 369955, 1244356, 4689667]

我想根据客户查看模式的聚合将通常一起查看的产品聚类到单独的集群中。我怎么做?

我采取的另一个步骤是将此数据加载到 Elasticsearch 中,并使用我的每个 product_ids 对客户视图执行显着_terms 查询。然后,我为最有可能一起查看的每个产品返回 10 个产品,以及一个分数。我的最终愿望是能够以描述不同“个性”类型或兴趣的方式对这些产品数据进行聚类。

像neo4j这样的图形数据库可以在这里提供帮助还是其他一些聚类算法?

0 投票
1 回答
876 浏览

python-3.x - 如何使用 Python 将“文本文档”与“球形 k 均值”聚类?

我已经完成了传统的 k-means 文本聚类。但是,现在,我需要将我的程序修改为“球形 k 均值文本聚类”,但还没有成功。

我在网站上搜索了解决方案,但仍然无法成功修改我的程序。以下是对我的项目有帮助的资源,但我仍然无法找到方法。

  1. https://github.com/jasonlaska/spherecluster
  2. https://github.com/khyatith/Clustering-newsgroup-dataset
  3. Python中的球形k-means实现

这是我传统的 K-means 程序:

我希望使用“球形 k 均值聚类”对文本文档进行聚类。

0 投票
1 回答
921 浏览

python - 使用 TENSORFLOW2 进行 Kmeans 聚类

如何将包含 47 列和 99999 行的 pandas 数据库转换为 Tensorflow 2 中的张量?Kmeans 算法是否已经在 TF 2 下实现?因为该命令tf.contrib.factorization.KMeans在 TF2 下不起作用,因为tf.contrib第二个 API Tensorflow 上不再存在

  1. 项目清单
0 投票
2 回答
141 浏览

julia - 在 Julia 中计算 K-Means 的余弦相似度

我正在 Julia 中实现 K-means 聚类。

找出并实现 k-means 的修改,它可以通过向量之间的角度来测量相似度。

所以我假设可以为此使用余弦相似度,我通过计算欧几里得距离的平方,使代码与常规 K-means 一起工作:

我试图通过使用余弦相似度来做到这一点,例如:

但这似乎不起作用。

我误解了这个问题还是我执行错了?