问题标签 [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 中查找和标记由 hclust() 创建的簇的质心?
我在那里阅读了该线程,但在该线程中,答案是使用群集 i 的列均值(因此,如果我总共有 3 个群集,则 i = 1、2、3;如果我总共有 2 个群集,则 i = 1,2)。我将在此处复制并粘贴他们的答案:
但这对我来说没有意义!如果我有一个包含 3 个变量/列的数据集,并且我只想要 2 个集群,使用他们的方法,只使用第 1 列和第 2 列的列平均值,并且永远不会计算第 3 列的列平均值!
假设我创建了这样的数据表:
最后一行将返回如下数据表:
然后我缩放数据:
计算距离并创建层次聚类并切割树:
假设我得到了 2 个集群,我如何比较这 2 个集群的质心?以及如何将标签添加到集群???
r - 如何导出 hclust 集群结果
我是 R 新手,但我已经被这个问题困扰了好几个星期了。我有一个包含 343 个观察值和 28 列的数据集。这 28 列中的第一列是标识符。在运行分析之前,我使用 省略了 ID 列newdata <- olddata[,2:28]
,然后继续运行聚类分析。我得到了结果,一切看起来都很好;但是现在,我想恢复标识符并将其导出为文本文件,以及至少每个观察的标识符及其相应的簇号。这是一组空间数据,需要放回 GIS 中进行映射。当我使用 k-means 时,这很容易做到,但我不知道如何处理 hclust 结果。
r - 将 cluster.stats 与 hclust 一起使用
我在两个不同的 hclust 集群上使用 cluster.stats 时遇到问题。那不可能吗?
我使用的是版本 0.99.491 – © 2009-2015 RStudio, Inc.,安装了以下软件包:
我正在创建这些集群:
但是当在它们上使用 cluster.stats 时,我得到一个错误:
错误(在丹麦设置中):
我错过了什么?
r - 从热图中提取树状图时出错
我正在尝试使用 heatmap.2 函数从二进制矩阵创建热图,并从热图中提取树状图,并将树状图保存为 newick 文件格式。该矩阵在行上有基因组,在列上有基因。
为此,我正在运行以下代码。
当我尝试运行它将完整配置文件时,此代码运行良好。但是当我减少基因列的数量时,我在尝试将树状图转换为 hclust 对象的步骤中遇到错误。
错误:all(vapply(s, is.integer, NA)) 不是 TRUE
我尝试在我的数据集中查找任何“NA”值,但没有,否则它也不应该适用于完整数据集。
任何人都可以帮我解决这个错误吗?或建议发生此错误的可能原因是什么?
r - r:使用 hclust() 时在表/数据框中获取最终集群结果
我正在通过使用进行层次聚类分析hclust()
代码如下所示:
现在,我所需要的只是获取一个包含所有集群和属于它们的观察值(通过它们的行名,而不是编号)的表(或等效的东西),以便我可以将它保存到一些整体文件/数据框 - 例如 Excel。(我想用不同的方法、变量多次运行 hclust 并最终评估结果。)
我现在,它可能很容易,但我不知何故被卡住了......你有什么建议吗?
Ps.:我也想知道使用时这是如何工作的kmeans()
r - r:在 for() 循环中部署 NbClust() 调用时出错 - “if ((res[ncP - min_nc + 1, 15] <= resCritical[ncP - min_nc + :”
我想NbClust()
为几个数据框调用该函数。我通过包含NbClust()
函数调用的 for 循环“发送”它们来做到这一点。代码如下所示:
不幸的是,它总是会产生以下错误。奇怪的是,如果我在没有循环的情况下应用相同的函数调用(即仅对一个数据帧),它可以完美地工作......那么有什么问题?
我查看了源代码,NbClust
确实有一行包含错误消息的代码,但我无法相应地更改代码。你知道问题可能是什么吗?
if ((res[ncP - min_nc + 1, 15] <= resCritical[ncP - min_nc + : 需要 TRUE/FALSE 的缺失值
此外,它还会产生以下警告:
数据如下:
r - 为什么 hclust 和 heat map.2 使用相同的聚类函数的结果不同?
我正在尝试更多地了解我的数据进行一些聚类分析。使用相同的数据,我首先使用以下代码完成了 hclust:
我有两个明确的集群。很好。
然后我再次使用相同的数据和相同的设置做一个热图。2(我有遗传数据)。这是代码:
问题是我根本没有得到两个清晰的集群,就像只使用 hclust 一样。任何人都可以指出我为什么会这样?我发现的唯一类似的问题是在 R 中理解热图树状图聚类,但它是关于两个命令来做热图,并且设置存在差异,但我的理解是我设置了相同的设置,所以我应该期望相同?有什么很明显的我想念的吗?
此外,我得到两个集群的唯一方法是在 heatmap.2 中改变,“manhattan”的距离函数中的方法,然后是“complete”的 hclust,但是,一些样本仍然在不同的集群中,而不是我刚刚做的集群。这是什么原因?那我应该相信什么?
很抱歉,我无法展示真实数据,因为它是保密的,所以你需要相信我没有得到相同的结果:/
任何帮助或启发将不胜感激!谢谢!
- 编辑 -
所以我尝试了虹膜数据,虽然集群相似,但它们并不完全相同。这是 hclust 的代码:
这是heatmap.2的一个:
我知道这不是有史以来最好的例子,就我而言,集群更加不同......
r - 在 hclust 的每一步中查看距离矩阵
如何在层次聚类算法的任何步骤中看到距离矩阵(使用hclust
函数R
)?