问题标签 [hierarchical-clustering]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1125 问题

0 投票

1 回答

3195 浏览

python - 在 scipy 中修剪树状图（分层聚类）

我有一个包含大约 5000 个条目的距离矩阵，并使用 scipy 的层次聚类方法对矩阵进行聚类。我用于此的代码是以下代码段：

由于所有这些数据的树状图会变得相当密集，因此我使用 truncate_mode 对其进行修剪。所有这些都有效，但我想知道如何找出原始 5000 个条目中哪些属于树状图中的特定分支。

我尝试使用

获取叶子列表，但这使用链接输出作为数据，虽然我可以看到修剪后的树状图和叶子列表之间的对应关系，但手动将原始条目映射到树状图变得有点麻烦。

总结一下：有没有办法列出距离矩阵中属于修剪树状图中分支的所有原始条目？或者还有其他我不知道的方法。

谢谢

python hierarchical-clustering

2012-04-24T19:56:33.757

0 投票

0 回答

452 浏览

python - 将 scipy 树状图输出到 TreeView 文件

我已经使用 pylab 和 scipy 编写了一个 python 脚本，以根据这篇文章从表达式矩阵中输出层次聚类热图和树状图：在 python 中的数据矩阵上绘制层次聚类的结果

现在我想将我的数组和基因（列和行）树状图导出到文本文件中，这样程序 TreeView 也可以查看这些数据（例如，cdt、gtr、atr 文件）。这个事情谁有经验？

谢谢

2012-06-04T21:33:28.977

0 投票

1 回答

3230 浏览

java - WEKA HierarchicalClusterer 类总是返回 2 个集群

这是我的代码：

现在，即使我也修改了 distancefucntion 方法，生成的簇数的输出始终为 2。如果是哪个集群，我怎么知道哪个实例？当我取消注释上面为获取实例的分布而编写的代码时，我得到一个 ArrayOutOfBound 异常。

但总的来说，谁能解释一下 WEKA 在这里是如何分层完成聚类的？

这是我的数据集，长度为 10，维度为 2：

java cluster-analysis weka data-mining hierarchical-clustering

2012-06-05T08:19:06.947

0 投票

2 回答

1533 浏览

python - 如何在 scipy-cluster 的每个集群中选择离中心最近的代表？

所以基本上，我使用 Python 模块scipy-cluster来绘制大量数据点。如果给定阈值或我想要的代表数量，是否有方法/功能可以给出每个集群的代表？理想情况下，每个代表必须与它所属的集群中心的距离最近。

编辑：我正在寻找每个集群中最接近质心的数据点。

python cluster-analysis hierarchical-data hierarchical-clustering

2012-06-19T02:45:03.397

0 投票

2 回答

1203 浏览

r - 从 R 中的 hclust 中提取文本中的树结构

在需求预测项目的范围内，我想确定对彼此相似的时间序列进行分组的最佳方法，以便我可以应用自上而下的预测算法。目前，我的关键问题是确定什么是适当的组以及这些组的适当层次结构是什么。在做了一些阅读之后，我相信动态时间扭曲可能会有所帮助。为了对此进行测试，我创建了一个小测试用例，但我面临一个问题，那就是我如何提取层次结构，例如文本树或类似的东西。我希望你们中的一个人能够进一步帮助我。

我创建了以下案例来展示我的目标。

不知何故，我想以文本形式获取集群的名称和成员，以便我可以继续使用它。有人有想法吗？

谢谢！

r forecasting hierarchical-clustering hclust

2012-06-20T20:40:56.773

0 投票

5 回答

6952 浏览