问题标签 [hclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3230 浏览

r - 如何更改集群中每个组的树状图颜色

这是我的数据

我在这里做什么

它给了我我想要的如下在此处输入图像描述

这里所有组都用黑色显示,并且树状图不是很清楚我想要的是更改每个组的颜色并使用垂直名称而不是数字,最后我希望能够移除 hclust( " ward.D2") 同时根据需要更改 x 标签和 y 标签

0 投票
1 回答
1491 浏览

r - 在 R 中指定簇的数量

R中有没有办法在不手动指定的情况下确定生成的集群数量?

在从字符串值中提取一些“字母”之后,我将具有 30000 个不同值的变量放入集群中,以便我确定哪些值应该被同等对待。因为有些值应该是相同的,但在空格、标点符号等方面不同。例如,

应归类为 1

我制作了一个 30000 x 30000 矩阵,其中元素是一个单词到另一个单词的距离。

请看结果树状图

下面的代码是我用于较小数据的代码,不过,这在这里不适用,因为由于大量输入,我无法检查绘图。凌乱的树状图,所以我无法检测输出了多少簇

我不知道要生成的集群数量。我依赖于 hclust 本身的输出,所以我没有办法做 cutree,因为我需要指定参数 k

0 投票
1 回答
283 浏览

r - 在 R 中的上三角形上使用 hclust

我有一个像这样的矩阵:

是否可以hclust在不将矩阵对角拼接的情况下在上三角形上使用?

0 投票
1 回答
405 浏览

r - Get indices of cutree of hclust

Its a very basic question, unfortunately I do not know how to ask it. Lets say I have the following code for clustering using hclust:

Lets assume sort(s) gives the following result:

How can I get Alabama Alaska Arizona Delaware Florida in a list without the bottom cluster number getting appended to it.

0 投票
1 回答
7377 浏览

r - 大型数据集上的 R 中的 hclust()

我正在尝试在 R 中实现层次聚类: hclust() ;这需要一个由 dist() 创建的距离矩阵,但我的数据集大约有一百万行,甚至 EC2 实例也用完了 RAM。有解决方法吗?

0 投票
1 回答
1916 浏览

r - 如何在r中切割树状图

好的,所以我确定以前有人问过这个问题,但是经过数小时的搜索后,我在任何地方都找不到好的答案。

我有一些数据,我进行分类,然后制作树状图。

问题与美学有关,特别是;(1)如何根据组的数量进行切割(在这个例子中我想要3个),(2)使组标签与树的分支对齐,(2)重新缩放以便没有任何巨大组间差距

更多关于 (3)。我的数据集物种非常丰富,大约有 1000 个组没有切割。如果我在 3 处切割,这棵树的右侧有一些树枝,右侧有一“英里”,我想重新缩放以使其更接近。所有这一切都可以通过外部程序实现,但我想在 r 中完成这一切!

  1. 如果您可以将平均轮廓宽度图嵌套在该图的右上角,则可以加分

这是使用虹膜数据的示例

0 投票
1 回答
706 浏览

r - 绘制带有许多零的非常大的数据

这是非常大数据的一小部分

我想要的是当数据中有很多零时以更有压力的方式显示值

我如何绘制它是这样的

但正如你所看到的,在这个小例子中,零主宰了我的情节,当它非常大时,什么都看不到。我也不能改变值的位置

0 投票
1 回答
162 浏览

r - 使用 identify.hclust() 获取切割高度

我正在手动切割从hclustR 中创建的树状图,使用identify.hclust. 该函数的默认返回是每组中观察的 ID。我需要这些信息,但我也需要知道这个组的高度。有什么办法吗?非常感谢!

可重现的数据:

例如,我使用以下高度切割树状图,identify并希望获得分支的合并高度:

0 投票
0 回答
648 浏览

r - R中的hclust,dist解释了聚类单词的方法

我正在使用 twitter API 和 OAUTH 处理一些推文数据。我正在制作一个聚类树状图来聚类 500 条推文中使用的单词。我不确定 hclust 函数是如何对单词进行聚类的。即根据什么规则我需要一些逻辑解释

这是代码

RStudio 图像

我在 R 中包含了我正在查看的内容的图像。

0 投票
1 回答
169 浏览

r - 如何使用要在 hclust 中使用的变量创建向量

我在应用到 df 的大型脚本中使用 hclust 函数,如下例所示:

我只想在df中指定一次变量,例如。MgO、Zn、CaO ......当我调用 hclust() 时,我想自动拥有它们。

我尝试创建一个向量,该向量将以我将用于 hclust 调用的格式包含数据帧变量。但生成的树状图不正确。

这给出了以下内容:

并在 hclust 调用中使用了这个向量:

但是出了点问题,因为即使它没有给出错误,生成的树状图也不正确(所有垂直线都相等)

谢谢!!

样本数据在: https ://github.com/esteful/kaixo