问题标签 [cluster-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1553 浏览

sql-server - SQL Server 2008 空间聚类

我正在尝试根据密度和相对距离对地理空间数据点进行分组。有没有一种方法可以在 SQL Server 2008 中使用空间特征来完成,或者将数据转换为图形数据并使用图形聚类算法会更好吗?

0 投票
1 回答
617 浏览

c++ - 通过 MPI 在集群中进行主成分分析

我正在设置一组计算机,在 MPI 之上运行数学程序。您是否知道是否存在一些使用 MPI 进行 PCA - 主成分分析的库以便使用联网 pc 的所有资源?我会看看 Scalapack,但你知道其他库吗?我的语言是 linux 上的 C++ 但如果有一个好的库也适用于 windows 是一样的

谢谢

0 投票
2 回答
523 浏览

.net - .NET 的集群 F/OSS 库

有人知道用于聚类算法的 F/OSS 库吗?对层次聚类特别感兴趣。当然有一些可用的库,不需要从头开始编写。

ps 我知道 NMath,它是 $ ware

0 投票
3 回答
6102 浏览

matlab - 在 MATLAB 中围绕数据点组绘制多边形

我有一组数据点,每个数据点都属于某个集群(组)。我需要围绕这些集群中的每一个绘制一个多边形。有谁知道该怎么做?

我是否使用实际数据点来绘制多边形并不重要。我只需要将它们包裹在多边形中。

0 投票
4 回答
966 浏览

algorithm - 生成像城市一样分布的随机点?

如何生成 1000 个随机点,其分布类似于俄亥俄州的城镇?
恐怕我无法准确定义“像城市一样分布”;均匀分布的中心 + 小高斯云很容易但特别。
补充:必须有一个具有聚类参数的二维分布族,可以改变以匹配给定的一组点?

0 投票
1 回答
125 浏览

python - 从 Python 中的单独列表中提取和集成数据

我有这个代码:

我有 7 个组名称 1,...,7 。“tags”列表中的每一行对应“T”列表中的一行。“T”的值表示例如“tags”列表中的第一行属于第3组,“tags”列表中的第二行属于第 5 组,以此类推。这些基本上是每个标签所属的集群。我想提取它们,方法是让每个组/集群都在一个单独的例如字典数据类型中。重要的是每次运行时集群的数量都会发生变化。所以我需要一个通用代码可以处理不同数量的集群来解决这个问题。我真的需要你的帮助谢谢。

0 投票
1 回答
3289 浏览

tomcat - 如何估计tomcat服务器需求?

我们编写了一个在 Tomcat 上运行的全新 webapp。到目前为止,只有一个客户全天使用它。他们每天运行大约 180 次唯一登录。不是很多海事组织。现在,我们设法将它卖给了一个喜欢并希望将其推广给 50,000 名客户的全新客户。他们中有多少人将同时登录 - 不知道。但我需要做整件事——分配、创建、配置和维护。好的 - 最后很简单(errrr)。

该应用程序在 Gentoo 上运行 Tomcat 5.5(我正在考虑升级到 Tomcat 6),后面有 MSSQL 和 mySQL。我确实意识到更适合企业的应用程序会更合适,但目前这不是一个选择。由于我以前从未这样做过,我有点迷茫。有人可以就如何估计该客户的设备要求提出建议吗?Tomcat确实有集群,所以我可以做到。MS SQL - 我相信他们也有一些东西。我想把它放在 LVS 后面(我们现在也用它来做别的事情)。

非常感谢处理这些细节的人的任何帮助!

0 投票
1 回答
12396 浏览

python - Python scipy/numpy中相关性的层次聚类?

如何在scipy/中的相关矩阵上运行层次聚类numpy?我有一个 100 行乘 9 列的矩阵,我想通过 9 个条件下每个条目的相关性来分层聚类。我想使用 1-pearson 相关性作为聚类的距离。假设我有一个包含 100 x 9 矩阵的numpy数组X,我该怎么做?

我尝试使用 hcluster,基于此示例:

但是,pdist这不是我想要的,因为那是欧几里得距离。有任何想法吗?

谢谢。

0 投票
6 回答
19318 浏览

cluster-analysis - 使用哪个机器学习库

我正在寻找一个理想情况下具有以下功能的库:

  • 实现多维数据的层次聚类(最好在相似度或距离矩阵上)
  • 实现支持向量机
  • 在 C++ 中
  • 有一些记录(这似乎是最难的)

我希望它使用 C++,因为我最喜欢这种语言,但如果库值得,我也会使用任何其他语言。我用谷歌搜索并找到了一些,但我真的没有时间全部尝试,所以我想听听其他人的经验。请仅在您对推荐的图书馆有一定经验的情况下回答。

PS:我还可以为集群和 SVM 使用不同的库。

0 投票
3 回答
924 浏览

python - GeoDjango:是否有一种开箱即用的方法来生成点簇?

我正在尝试使用 GeoDjango 在 Python 中的一组点上计算集群。

问题:给定一组点,输出一组这些点的集群。(我可以提前指定簇数/簇大小/距离以简化)

网络上有一些解决方案可以进行集群,所以这是一个众所周知的问题。我认为 GeoDjango 会开箱即用地处理这些类型的问题,但不清楚如何 - 我搜索了 GeoDjango 文档、谷歌和其他一些地方,但找不到任何东西。

在推出我自己的集群解决方案之前,我想我想看看是否有一种直接的方法可以使用 GEOS 或 GeoDjango 中的其他包来做到这一点。