问题标签 [hierarchical-clustering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 如何在图表中保存社区信息
我有一些使用 Neo4j 保存的图形数据库(朋友网络、购买历史等)。我计划使用Girvan Newman等社区检测算法来分析这些。这些算法通常返回一个树状图,表示图从整个网络到各个节点的划分。我想知道如何坚持这些结果。我想它可以存储为单独的图表,但是有没有办法将它存储在图表本身中?我这样做的担心是需要创建节点来表示组,这是我想避免的。
matlab - 集群数据 Matlab 函数
我正在使用 Matlab clusterdata 函数将我的数据(噪声和非噪声)分为两类:噪声组和非噪声组。该函数运行良好,只是有时它将所有噪声数据命名为组 1,将所有非噪声数据命名为组 2。有时它将所有噪声数据命名为组 2,将所有非噪声数据命名为组 1。
我该如何控制它?我的意思是将所有噪声数据标记为第 1 组。
matlab - 如何在 Matlab 或 R 中进行重叠聚类分析?
我有一个大小为 20 x 300 的二进制矩阵。我想将 20 个变量聚集成五六组。到目前为止,我在 matlab 中使用了具有不同距离度量的 kmeans 和层次聚类算法,但两者都给了我不重叠的聚类。我从我的数据中看到,一些变量应该位于多个组中。有谁知道是否有办法在matlab ot R中进行重叠集群?任何帮助是极大的赞赏。提前致谢!
python - 如何从 SciPy 的层次凝聚聚类中获取质心?
我正在使用 SciPy 的分层凝聚聚类方法来聚类特征的 amxn 矩阵,但是在聚类完成后,我似乎无法弄清楚如何从生成的聚类中获取质心。下面是我的代码:
我正在使用我的特征矩阵,计算它们之间的欧几里德距离,然后将它们传递给层次聚类方法。从那里,我正在创建平面集群,最多 100 个集群
现在,基于平面簇 T,我如何获得代表每个平面簇的 1 xn 质心?
r - R中层次聚类的奇怪错误
我的 R 程序如下:
我的输入是一个距离矩阵(当然是对称的)。当我使用大于大约数千条记录的距离矩阵执行上述程序时(数百条记录都没有发生),它给了我错误消息:
我的机器有大约 16GB 的 RAM 和 4CPU,所以不会是资源问题。
任何人都可以让我知道有什么问题吗?谢谢!!
python - 无法让 scipy 层次聚类工作
我编写了一个简单的脚本,旨在对一个简单的测试数据集进行层次聚类。
我发现函数fclusterdata可以将我的数据聚集到两个集群中。它需要两个强制调用参数:数据集和阈值。问题是,我找不到可以产生预期的两个集群的阈值。
如果有人能告诉我我做错了什么,我会很高兴。如果有人能指出更适合我的集群的其他方法,我也会很高兴(我明确希望避免事先指定集群的数量。)
这是我的代码:
这是输出:
r - 用替换和聚类置换矩阵的列
如何用 R 中的替换置换矩阵的列?我找到了一个名为 rmperm {sna} 的函数,但它同时置换了列和行,而我只想置换我的列。
编辑:我必须对矩阵进行 1000 次置换,然后进行层次聚类,这样我就有了 1000 次随机化后的最终树。
非常感谢。
r - 随机化和分层树
我正在尝试置换(仅按列)我的数据矩阵 1000 次,然后在“R”中进行层次聚类,因此在 1000 次随机化后我的数据上有最终的树。这就是我迷路的地方。我有这个循环
我不确定最终的树是 1000 次随机化之后的产物,还是只是它在循环中计算的最后一棵树。另外,如果我想在树上显示引导值,我应该怎么做?
非常感谢!!
algorithm - 测试聚类算法的最佳方法
测试聚类算法的最佳方法是什么?我正在使用带有停止标准的凝聚聚类算法。如何测试集群是否正确形成?