问题标签 [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的聚类分析表示
我正在对 x 和 y 是空间坐标的大型空间数据集进行聚类分析。我正在使用 hclust 和 dynamicTreeCut,然后为了表示我使用 ggplot 显示散点图。
但我无法正确可视化集群,因为我只能在行或列中显示剪切。
这是我想要的玩具样本,但是对于我的数据,集群只能在水平方向工作(所以我认为它应该只对 y 进行集群或可视化)。
r - How to create a newick file from a cluster in R?
This script below runs nicely to get the cluster with a huge data set, but I need to get the cluster into a newick file or a text file so I can export it from R to other editing programs but I can't find a way to get the hclust into a newick format, how can I do it? I feel the new2phylo function may do the job but we did not manage to make it work.
I would really appreciate your help as we have searched everywhere and can't find a solution =(
r - 如何突出显示树状图中的特定标签?
我使用以下简单的代码进行了聚类分析
我想强调一些特定的叶子(不是节点)。我在一个单独的向量中有这些叶子的列表。如何仅突出显示特定的叶子,而使所有其他叶子保持黑色?
r - 给定距离矩阵 256x256 的聚类
所以,我有 256 个对象,并计算了它们之间的距离矩阵(成对距离)。下面给出了我的距离矩阵的一个子集:
现在,我想使用这个距离矩阵对这 256 个对象进行相应的聚类。因此,我使用了 hclust,但出现了错误:
因此,即使我使用矩阵的较小子集,我仍然会得到相同的错误:
知道我的分析有什么问题吗?
r - R中水平树状图的树切割和矩形簇周围
我试图将层次聚类的结果绘制R
为树状图,矩形标识聚类。
以下代码对垂直树状图进行了处理,但对于水平树状图 ( horiz=TRUE
),不绘制矩形。有没有办法对水平树状图做同样的事情。
此外,我想绘制一条线以在所需的距离值处切割树。如何在 R 中绘制它。该cutree
函数返回集群,但也可以绘制它。
我正在寻找的所需输出是这样的。
如何在 R 中完成这项工作?
r - 数据集的子集作为单独的树状图,但在同一个图中
我知道我可以如下绘制树状图
但是,我确定了一些组(例如,通过迭代分类方法),作为最后一列给出d
我正在尝试将所有树状图以相同的比例绘制在同一个图上。还需要绘制只有一个成员的组。(第 6 组和第 7 组)
我能够为数据子集绘制单独的树状图,除非组中的成员数量只有一个。但我认为这不是正确的方法。
循环为最后两组给出此错误。(6 和 7) 只有一个成员。
基本上我不想重现这些类型的情节。此处还绘制了具有单个成员的集群。
r - 在R中的heatmap.2中选择树状图的叶节点数
在 Matlab 中,您可以指定要作为dendrogram
函数一部分绘制的树状图中的节点数:dendrogram(tree,P)
生成不超过 P 个叶节点的树状图。
我在 R 中做同样的尝试heatmap2
失败了。stackoverflow 和 biostars 的帖子建议使用cutree
,但heatmap2
被帖子的选项建议卡住了Rowv
。这里的“TAD”是 8 列乘 831 行的数据矩阵。
返回消息:
是否使用cutree
正确的途径来探索绘制受限树状图?有没有更简单的方法来做这个类似于matlab?
r - 生物时间课程数据的热图
下面的数据显示了我的数据集中我的差异表达基因的一个子集。这些基因在整个时间过程中发生了很大的变化。在热图中显示这些变化的最佳方式是什么?目前我按时使用了聚类,但这没有意义,因为时间点的顺序发生了变化。
我想要这样的东西:
r - 最终合并的 R hclust 高度
使用 hclust 函数在 R 中执行层次聚类时。你怎么知道最终合并的高度?
因此,用一些 R 默认数据来澄清:
将产生一个包含所有聚类信息的变量 hc。
和树状图:
正如您在树状图上看到的,最终合并发生在高度 > 200(约 300)处。但是树状图是怎么知道的呢?此信息不在 hc.height 变量中,也不在 dendrogram1 变量中。提到的最高合并是 169。
如果 dendrogram1 变量不包含此信息,绘图函数如何知道合并必须发生在 300 的高度?
我问这个是因为我需要这个数字 (+- 300) 用于其他应用程序,并且从图中读取它是完全不切实际的。
提前感谢任何愿意提供帮助的人!
r - 如何将以下相似度矩阵转换为距离矩阵以执行 hclust?
我正在尝试使用 hclust 对图形的节点(C1、C2、C3 ...)进行聚类,我的相似度指标是节点之间的链接数。
我有类似的数据
基本上这是一个相似度矩阵
这是一个无向图,其中 C1 和 C3 之间的相似性为 3 个链接。我需要将此数据转换为合适的 dist.matrix
基于我的相似性指标(两个节点之间的#links)的格式。我该怎么做呢?