问题标签 [cluster-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1554 浏览

google-maps - Google Maps Tiles - 如何将 30k 坐标划分为图块

是否可以有效地将 30k(并且还在增长)或更多坐标划分为 Google 地图上的图块?

我的目标是索引所有坐标 - 分配给一个图块,然后为每个缩放级别定义一个图块大小。

在客户端,标记管理器将对每个图块进行聚类(理想情况下,该图块的点数少于 200)

新坐标将自动分配给特定的图块。

0 投票
5 回答
1551 浏览

php - 将大量文本(聚类)与矩阵进行比较

我有以下 PHP 函数来计算文本之间的关系:

该变量$terms_in_articleX必须是一个数组,其中包含出现在文本中的所有单个单词。

假设我有一个包含 20,000 条文本的数据库,这个函数将花费很长时间来运行所有连接。

我怎样才能加速这个过程?我应该将所有文本添加到一个巨大的矩阵中,而不是总是只比较两个文本吗?如果您有一些代码方法,最好是在 PHP 中,那就太好了。

我希望你能帮助我。提前致谢!

0 投票
3 回答
420 浏览

cluster-analysis - 寻找基于对象属性对对象进行分类的方法

我有一组 ~10K 对象,每个对象都有大约 150 个不同的属性,其中大约四分之一是多值的和/或与其他属性相关的。

我有一组大约 120 个类别,我想将这些对象分类到其中,每个类别都被定义为一个“模板”对象。如果一个实例与模板完全匹配,则该对象显然属于该类别……但是,实际上只有大约 10% 的对象具有完全匹配的模板。因此,我希望能够根据对象与类别的相似性对对象进行评分,并将它们分类为最佳匹配。我还想识别非常相似的对象集群,表明新/改进类别的潜力。

这似乎是 Weka、RapidMiner 或其他机器学习/集群/分类系统的工作。但是,我很难找到该领域的良好介绍材料,因此无法说明在这种情况下使用这些工具需要付出多少努力。鉴于这可能是一个持续的需求,我想使用一些可以让我轻松更改分析方法、权重等的东西。

想法?

0 投票
4 回答
18381 浏览

algorithm - 寻找集群的中心

我有以下问题 - 抽象出来以提出关键问题。

我有 10 个点,每个点都有一些距离。我想要

  1. 能够找到簇的中心,即与其他点的成对距离最小的点, 令 p(j) ~ p(k) 表示点 j 和 k p(i) 之间
    的成对距离 -
    集群的点 iff p(i) st min[sum(p(j)~p(k))] for all 0 < j,k <= n 其中我们在集群中有 n 个点
  2. 一旦集群中的数据点数量超过某个阈值 t,确定如何将集群拆分为两个集群。

这不是欧几里得空间。但是距离可以总结如下 - p(i) 是点 i:

我将如何计算哪个是该集群的中心点?

0 投票
3 回答
3861 浏览

terminology - -fold 的含义

我在阅读维基百科时看到了这段文字(http://en.wikipedia.org/wiki/K-means%2B%2B

作者使用真实和合成数据集测试了他们的方法,通常速度提高了 2 倍,而某些数据集的误差提高了近 1000 倍。

我很好奇-fold的含义,比如1000-fold,2-fold。这是一种单位吗?或者其他的东西?谁能给我一些关于这个术语的参考资料?

0 投票
5 回答
1558 浏览

java - 在 Java 中使用线程进行集群

我有一份在 Java 中需要很长时间的工作。所以我想把这个工作分成线程并运行它们。线程完成他们的工作后,返回到我的服务和服务给他们新的工作。ThreadGroup 适合这个或任何其他推荐?

0 投票
2 回答
5109 浏览

php - K-means 聚类:怎么了?(PHP)

我一直在寻找一种方法来计算足球经理游戏中的动态市场价值。我在这里问了这个问题,并从 Alceu Costa 那里得到了很好的回答。

我试图编写这个算法(90 个元素,5 个集群),但它不能正常工作:

  1. 在第一次迭代中,大部分元素会更改其集群。
  2. 从第二次迭代开始,所有元素都改变了它们的集群。
  3. 由于该算法通常在收敛之前有效(没有元素更改其集群),因此在我的情况下它不会完成。
  4. 所以我手动将结束设置为第 15 次迭代。你可以看到它无限运行。

你可以在这里看到我的算法的输出。它出什么问题了?你能告诉我为什么它不能正常工作吗?

我希望你能帮助我。非常感谢您!

这是代码:

0 投票
5 回答
22951 浏览

matlab - Matlab:K-means聚类

我有一个 A(369x10) 的矩阵,我想将它聚集在 19 个簇中。我用这个方法

产生 idx(369x1) 和 ctrs(19x10)

我明白了这一点。我在 A 中的所有行都聚集在 19 个集群中。

现在我有一个数组 B(49x10)。我想知道这个 B 的行在给定的 19 个簇中对应的位置。

在 MATLAB 中怎么可能?

先感谢您

0 投票
8 回答
13096 浏览

php - 地图聚类算法

我当前的代码非常快,但我需要让它更快,以便我们可以容纳更多的标记。有什么建议么?

笔记:

  • 当 SQL 语句按标记名称排序时,代码运行速度最快——它本身只完成了对标记进行聚类的部分工作(同一位置的标记名称通常,但并不总是相似)。
  • 我不能预先对标记进行聚类,因为它们可以被动态搜索和过滤。
  • 我尝试过基于网格的聚类——但结果通常不是很好。
  • 我知道星团在墨卡托投影上略微倾斜。
  • 我对商业集群服务不感兴趣。

编码:


更新

这是当前代码:

0 投票
1 回答
7081 浏览

image - 数据聚类如何帮助图像或模式识别

我一直在使用不同的数据聚类算法来寻找代表节点的随机数据点之间的聚类,我一直在阅读数据聚类用于图像识别。我无法建立联系,聚类数据如何帮助识别图像或面部识别。有人可以解释一下吗?