问题标签 [hclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4609 浏览

r - 使用 r 中的 ggdendro 向 ggplot 中的树状图添加标签

如何将标签添加到 ggdendro 图?我通过阅读 ?dendro_data 意识到我应该使用调用“标签”,但找不到实际实现的示例。任何人都可以演示如何将叶子标签添加到下面的示例中。谢谢

0 投票
0 回答
6618 浏览

r - 导出 hclust 集群成员

我是 R 新手。我正在尝试做 hclust 并导出集群成员。我使用了以下内容。这是正确的还是有更好的方法?

谢谢R

0 投票
1 回答
5418 浏览

r - R中的多尺度层次聚类错误

我正在使用名为 的 R 包进行层次聚类,该包pvclust通过hclust合并引导来计算获得的聚类的显着性水平。

考虑以下具有 3 个维度和 10 个观察值的数据集:

当我hclust单独使用时,聚类对于欧几里得度量和相关度量都运行良好:

但是,当使用 each 设置时pvclust,如下所示:

...我收到以下错误:

  • 欧几里得:Error in hclust(distance, method = method.hclust) : must have n >= 2 objects to cluster
  • 相关性:Error in cor(x, method = "pearson", use = use.cor) : supply both 'x' and 'y' or a matrix-like 'x'

请注意,距离是通过计算的,pvclust因此不需要事先计算距离。另请注意,hclust方法(平均值、中位数等)不会影响问题。

当我将数据集的维度增加到 4 时,pvclust现在运行良好。为什么我pvclust在 3 维及以下得到这些错误,但没有得到这些错误hclust?此外,当我使用 4 维以上的数据集时,为什么错误会消失?

0 投票
2 回答
5490 浏览

r - hclust 大小限制?

我是 R 新手。我正在尝试在大约 50K 项上运行 hclust()。我有 10 列要比较和 50K 行数据。当我尝试分配距离矩阵时,我得到:“无法分配 5GB 的向量”。

这个有大小限制吗?如果是这样,我该如何去做这么大的事情?

编辑

我最终增加了 max.limit 并将机器的内存增加到 8GB,这似乎已经修复了它。

0 投票
1 回答
1192 浏览

r - as.dendrogram 中的错误

我正在尝试使用大数据制作树状图

我正在使用statsphyclust库,

hclust工作正常,我可以绘制它并正确绘制它。在我使用该as.dendrogram功能后,它不会给我一个错误。但是当我要么:

  • 尝试绘制它
  • 用于dendrapply应用功能。

它说:

as.dendrogram 的问题是无法处理大型数据集(~30000)吗?如果是这样,是否有替代方案?

0 投票
2 回答
36769 浏览

r - R中带有标签的水平树状图

我正在尝试从hclust函数输出中绘制树状图。我希望树状图是水平排列的而不是默认的,可以通过(例如)

我尝试使用as.dendrogram()类似的功能,plot(as.dendrogram(hc.poi),horiz=TRUE)但结果没有有意义的标签:

在此处输入图像描述

如果我使用plot(hc.poi,labels=c(...))which is without the as.dendrogram(),我可以传递labels=参数,但现在树状图是垂直的而不是水平的。有没有办法同时水平排列树状图并分配用户指定的标签?谢谢!

更新:作为 USArrests 数据集的示例,假设我想使用州名称的前两个字母的缩写作为标签,以便我想以某种方式传递labs给绘图函数:

labs = substr(rownames(USArrests),1,2)

这使

0 投票
1 回答
1139 浏览

r - 如何使用 R 绘制具有组间相似性的标签?

当我在 R 中使用命令 hclust 绘制树状图时,我将 y 轴标记为高度。但是,我想用我的数据集中各组之间的相似度来标记这个轴,如下图所示。我怎样才能做到这一点?

这是一个最小的例子:

0 投票
0 回答
173 浏览

r - 是否已经存在可以将任何列表作为树打印到控制台的 R 包(使用 ASCII 符号)?

我发现能够使用与str.dendrogram. 我编写了自己的函数,这种方法很有效,但重复努力是没有意义的。那么,有人知道已经这样做的任何软件包吗?或者一种从任意嵌套列表轻松创建假树状图或 hclust 对象而无需实际聚类的方法?

谢谢。

0 投票
1 回答
703 浏览

r - 将簇分配给R中的对象

将集群分配给 R 中的组的最简单方法是什么?使用的功能是:

hclust 和 cutree。

基本上,我想将在 cutree 下创建的集群之一分配给一个对象。

谢谢!

0 投票
2 回答
3216 浏览

r - 聚类序数数据

我想用 R 语言(编码)对我的数据(kmeans 或 hclust)进行聚类。我的数据是有序的,这意味着数据是李克特量表来衡量成本上升的原因(我有 41 个原因“变量”),范围从 1 到 5,其中 1 是无影响到 5 主要影响(我有大约 160观察“谁对原因进行排名”)......关于如何根据观察对 41 个原因进行聚类的任何帮助......我是否必须在聚类或任何有帮助的东西之前将比例转换为百分比或 z 分数...... .. 我真的需要你的帮助!!这是要使用的数据 https://docs.google.com/spreadsheet/ccc?key=0AlrR2eXjV8nXdGtLdlYzVk01cE96Rzg2NzRpbEZjUFE&usp=sharing

我想根据观察中出现的相似性对变量(列)进行聚类……我遵循 statmethods.net/advstats/cluster.html 中的代码;但我无法根据观察中出现的相似性对变量(列)进行聚类,并且我遵循 mattpeeples.net/kmeans.html#help 上的工作;但我不知道他为什么将数据转换为百分比,然后转换为 Z-score 标准化。