问题标签 [hclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
1641 浏览

r - 如何在 R 中查找和标记由 hclust() 创建的簇的质心?

我在那里阅读了该线程但在该线程中,答案是使用群集 i 的列均值(因此,如果我总共有 3 个群集,则 i = 1、2、3;如果我总共有 2 个群集,则 i = 1,2)。我将在此处复制并粘贴他们的答案:

但这对我来说没有意义!如果我有一个包含 3 个变量/列的数据集,并且我只想要 2 个集群,使用他们的方法,只使用第 1 列和第 2 列的列平均值,并且永远不会计算第 3 列的列平均值!

假设我创建了这样的数据表:

最后一行将返回如下数据表:

然后我缩放数据:

计算距离并创建层次聚类并切割树:

假设我得到了 2 个集群,我如何比较这 2 个集群的质心?以及如何将标签添加到集群???

0 投票
1 回答
401 浏览

r - 如何导出 hclust 集群结果

我是 R 新手,但我已经被这个问题困扰了好几个星期了。我有一个包含 343 个观察值和 28 列的数据集。这 28 列中的第一列是标识符。在运行分析之前,我使用 省略了 ID 列newdata <- olddata[,2:28],然后继续运行聚类分析。我得到了结果,一切看起来都很好;但是现在,我想恢复标识符并将其导出为文本文件,以及至少每个观察的标识符及其相应的簇号。这是一组空间数据,需要放回 GIS 中进行映射。当我使用 k-means 时,这很容易做到,但我不知道如何处理 hclust 结果。

0 投票
2 回答
1062 浏览

r - 将 cluster.stats 与 hclust 一起使用

我在两个不同的 hclust 集群上使用 cluster.stats 时遇到问题。那不可能吗?

我使用的是版本 0.99.491 – © 2009-2015 RStudio, Inc.,安装了以下软件包:

我正在创建这些集群:

但是当在它们上使用 cluster.stats 时,我得到一个错误:

错误(在丹麦设置中):

我错过了什么?

0 投票
1 回答
445 浏览

r - 从热图中提取树状图时出错

我正在尝试使用 heatmap.2 函数从二进制矩阵创建热图,并从热图中提取树状图,并将树状图保存为 newick 文件格式。该矩阵在行上有基因组,在列上有基因。

为此,我正在运行以下代码。

当我尝试运行它将完整配置文件时,此代码运行良好。但是当我减少基因列的数量时,我在尝试将树状图转换为 hclust 对象的步骤中遇到错误。

错误:all(vapply(s, is.integer, NA)) 不是 TRUE

我尝试在我的数据集中查找任何“NA”值,但没有,否则它也不应该适用于完整数据集。

任何人都可以帮我解决这个错误吗?或建议发生此错误的可能原因是什么?

0 投票
1 回答
2822 浏览

r - r:使用 hclust() 时在表/数据框中获取最终集群结果

我正在通过使用进行层次聚类分析hclust()

代码如下所示:

现在,我所需要的只是获取一个包含所有集群和属于它们的观察值(通过它们的行名,而不是编号)的表(或等效的东西),以便我可以将它保存到一些整体文件/数据框 - 例如 Excel。(我想用不同的方法、变量多次运行 hclust 并最终评估结果。)

我现在,它可能很容易,但我不知何故被卡住了......你有什么建议吗?

Ps.:我也想知道使用时这是如何工作的kmeans()

0 投票
1 回答
743 浏览

r - r:在 for() 循环中部署 NbClust() 调用时出错 - “if ((res[ncP - min_nc + 1, 15] <= resCritical[ncP - min_nc + :”

我想NbClust()为几个数据框调用该函数。我通过包含NbClust()函数调用的 for 循环“发送”它们来做到这一点。代码如下所示:

不幸的是,它总是会产生以下错误。奇怪的是,如果我在没有循环的情况下应用相同的函数调用(即仅对一个数据帧),它可以完美地工作......那么有什么问题?

我查看了源代码,NbClust确实有一行包含错误消息的代码,但我无法相应地更改代码。你知道问题可能是什么吗?

if ((res[ncP - min_nc + 1, 15] <= resCritical[ncP - min_nc + : 需要 TRUE/FALSE 的缺失值

此外,它还会产生以下警告:

数据如下:

0 投票
0 回答
62 浏览

r - 在 x 轴上具有不等距离的 hclust 图的参数?(右)

我想制作下面的图(对于一维 x),但是为了让我们将观察结果定位在 x 轴上的正确位置(而不是在它们的等级位置):

在此处输入图像描述

我怀疑在 R 中没有现成的函数可以做到这一点。关于如何编写这样的函数有什么建议吗?

0 投票
0 回答
915 浏览

r - 为什么 hclust 和 heat map.2 使用相同的聚类函数的结果不同?

我正在尝试更多地了解我的数据进行一些聚类分析。使用相同的数据,我首先使用以下代码完成了 hclust:

我有两个明确的集群。很好。

然后我再次使用相同的数据和相同的设置做一个热图。2(我有遗传数据)。这是代码:

问题是我根本没有得到两个清晰的集群,就像只使用 hclust 一样。任何人都可以指出我为什么会这样?我发现的唯一类似的问题是在 R 中理解热图树状图聚类,但它是关于两个命令来做热图,并且设置存在差异,但我的理解是我设置了相同的设置,所以我应该期望相同?有什么很明显的我想念的吗?

此外,我得到两个集群的唯一方法是在 heatmap.2 中改变,“manhattan”的距离函数中的方法,然后是“complete”的 hclust,但是,一些样本仍然在不同的集群中,而不是我刚刚做的集群。这是什么原因?那我应该相信什么?

很抱歉,我无法展示真实数据,因为它是保密的,所以你需要相信我没有得到相同的结果:/

任何帮助或启发将不胜感激!谢谢!

- 编辑 -

所以我尝试了虹膜数据,虽然集群相似,但它们并不完全相同。这是 hclust 的代码:

这是heatmap.2的一个:

我知道这不是有史以来最好的例子,就我而言,集群更加不同......

0 投票
0 回答
174 浏览

r - 在 hclust 的每一步中查看距离矩阵

如何在层次聚类算法的任何步骤中看到距离矩阵(使用hclust函数R)?

0 投票
1 回答
5306 浏览

r - 如何调整heatmap.2中的颜色范围

我正在尝试使用 R 语言绘制热图。

绘制热图图表后,我发现我的热图不适合解释,因为颜色键的范围没有调整好。

正如您在下面看到的,与我的数据分布相比,颜色键范围非常长。(它们在零到四之间)。因此,热图中的所有颜色都是绿色的。

在此处输入图像描述

如何解决这些问题?

以下是我的代码。(我试图搜索解决方案,但我没有找到适合我的案例的线程。)