问题标签 [hierarchical-clustering]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
570 浏览

algorithm - 如何在图表中保存社区信息

我有一些使用 Neo4j 保存的图形数据库(朋友网络、购买历史等)。我计划使用Girvan Newman社区检测算法来分析这些。这些算法通常返回一个树状图,表示图从整个网络到各个节点的划分。我想知道如何坚持这些结果。我想它可以存储为单独的图表,但是有没有办法将它存储在图表本身中?我这样做的担心是需要创建节点来表示组,这是我想避免的。

0 投票
1 回答
472 浏览

matlab - 集群数据 Matlab 函数

我正在使用 Matlab clusterdata 函数将我的数据(噪声和非噪声)分为两类:噪声组和非噪声组。该函数运行良好,只是有时它将所有噪声数据命名为组 1,将所有非噪声数据命名为组 2。有时它将所有噪声数据命名为组 2,将所有非噪声数据命名为组 1。

我该如何控制它?我的意思是将所有噪声数据标记为第 1 组。

0 投票
2 回答
1727 浏览

matlab - 如何在 Matlab 或 R 中进行重叠聚类分析?

我有一个大小为 20 x 300 的二进制矩阵。我想将 20 个变量聚集成五六组。到目前为止,我在 matlab 中使用了具有不同距离度量的 kmeans 和层次聚类算法,但两者都给了我不重叠的聚类。我从我的数据中看到,一些变量应该位于多个组中。有谁知道是否有办法在matlab ot R中进行重叠集群?任何帮助是极大的赞赏。提前致谢!

0 投票
2 回答
21809 浏览

python - 100万个对象的层次聚类

谁能给我指出一个可以聚类约 100 万个对象的层次聚类工具(最好在 python 中)?我试过了hcluster,还有Orange

hcluster18k 个对象有问题。Orange 能够在几秒钟内聚集 18k 个对象,但以 100k 个对象失败(内存饱和并最终崩溃)。

我在 Ubuntu 11.10 上运行 64 位 Xeon CPU (2.53GHz) 和 8GB RAM + 3GB 交换。

0 投票
2 回答
9509 浏览

python - 如何从 SciPy 的层次凝聚聚类中获取质心?

我正在使用 SciPy 的分层凝聚聚类方法来聚类特征的 amxn 矩阵,但是在聚类完成后,我似乎无法弄清楚如何从生成的聚类中获取质心。下面是我的代码:

我正在使用我的特征矩阵,计算它们之间的欧几里德距离,然后将它们传递给层次聚类方法。从那里,我正在创建平面集群,最多 100 个集群

现在,基于平面簇 T,我如何获得代表每个平面簇的 1 xn 质心?

0 投票
2 回答
2424 浏览

r - R中层次聚类的奇怪错误

我的 R 程序如下:

我的输入是一个距离矩阵(当然是对称的)。当我使用大于大约数千条记录的距离矩阵执行上述程序时(数百条记录都没有发生),它给了我错误消息:

我的机器有大约 16GB 的 RAM 和 4CPU,所以不会是资源问题。

任何人都可以让我知道有什么问题吗?谢谢!!

0 投票
1 回答
5087 浏览

python - 无法让 scipy 层次聚类工作

我编写了一个简单的脚本,旨在对一个简单的测试数据集进行层次聚类。使用的测试数据。

我发现函数fclusterdata可以将我的数据聚集到两个集群中。它需要两个强制调用参数:数据集和阈值。问题是,我找不到可以产生预期的两个集群的阈值。

如果有人能告诉我我做错了什么,我会很高兴。如果有人能指出更适合我的集群的其他方法,我也会很高兴(我明确希望避免事先指定集群的数量。)

这是我的代码:

这是输出:

0 投票
1 回答
492 浏览

r - 用替换和聚类置换矩阵的列

如何用 R 中的替换置换矩阵的列?我找到了一个名为 rmperm {sna} 的函数,但它同时置换了列和行,而我只想置换我的列。

编辑:我必须对矩阵进行 1000 次置换,然后进行层次聚类,这样我就有了 1000 次随机化后的最终树。

非常感谢。

0 投票
2 回答
235 浏览

r - 随机化和分层树

我正在尝试置换(仅按列)我的数据矩阵 1000 次,然后在“R”中进行层次聚类,因此在 1000 次随机化后我的数据上有最终的树。这就是我迷路的地方。我有这个循环

我不确定最终的树是 1000 次随机化之后的产物,还是只是它在循环中计算的最后一棵树。另外,如果我想在树上显示引导值,我应该怎么做?

非常感谢!!

0 投票
4 回答
3797 浏览

algorithm - 测试聚类算法的最佳方法

测试聚类算法的最佳方法是什么?我正在使用带有停止标准的凝聚聚类算法。如何测试集群是否正确形成?