问题标签 [hclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的层次聚类-'pvclust'问题
我做了一个可重现的例子,我遇到了 pvclust 的问题。我的目标是在层次聚类树状图中选择理想的聚类。我听说过“pvclust”,但不知道如何使用它。此外,如果有人有其他建议来确定理想的集群,那将非常有帮助。
提供了我的代码。
出现错误说明:
r - 基于共现的聚类
我想使用 R 基于 co-occurrences 关键字对数据进行聚类。与其他帖子相比,我遇到了 2 个困难。
- 词是不同层次的
- 关键字不一定按顺序或层次结构级别显示
例子
我希望结果是关键字在第一级分支到食品和家具。在第二个和第三个还有更多的分支,例如卧室、客厅。如果我使用层次聚类分析
我最终会将“家具”作为最低级别的类别之一,但在我的示例中它是一个“节点”。
有解决这个问题的功能吗?
最佳皮特
r - 在R中使用带有phylo对象(无根树)的cutree
我想使用 cutree() 函数将系统发育树聚类成指定数量的进化枝。然而,phylo 对象(一个无根的系统发育树)不是 unltrametric 的,因此在使用 as.hclust.phylo() 时会返回错误。目标是在保持最大多样性的同时对树的尖端进行子采样,因此希望通过指定数量的进化枝进行聚类(然后从每个进化枝中随机采样一个)。这将针对具有不同数量的所需样本的许多树完成。将无根树强制转换为 hclust 对象的任何帮助,或关于将树(phylo 对象)系统地折叠为预定义数量的进化枝的不同方法的建议将不胜感激。
返回:“as.hclust.phylo(tree) 中的错误:树不是超度量的”
如果我制作所有节点之间的分支长度的距离矩阵,我可以使用 hclust 生成集群,然后将 cutree 转换为所需数量的集群:
然而,结果并不理想,因为非常基础的分支聚集在一起。基于树结构的聚类,或者从尖端到根的距离将是更可取的。
任何建议表示赞赏!
r - hclust() with cutree ...如何在单个 hclust() 中绘制 cutree() 集群
我用 cutree() 将我的 hclust() 树聚类成几个组。现在我想要一个函数来 hclust() 几个 groupmembers 作为 hclust() ...另外:
我将一棵树分成 168 个组,我想要 168 个 hclust() 树……我的数据是 1600*1600 矩阵。
我的数据太大了,所以我举个例子
现在我想绘制 18 棵树……一组一棵树。我已经尝试了很多..
r - 从 hclust(分层聚类)对象中提取距离
我想计算我的聚类分析解决方案对实际距离分数的拟合程度。为此,我需要提取我正在聚类的刺激之间的距离。我知道在查看 树状图时我可以提取距离,例如 5 到 -14 之间是 0.219(它们连接的高度),但是有没有一种自动方法可以从 hclust 中的信息中提取距离目的?
r - R-在不使用 dist() 函数的情况下计算数据框元素之间的距离
我有一个大数据集(~188000 行),我想计算我的行之间的距离,这样我就可以应用该hclust
函数来确定我的数据集的中心,然后应用该kmeans
函数对我的数据进行分类。
我的问题是计算我的矩阵距离的第一步:使用dist
包中的函数stats
给了我这个错误:
很明显,这是一个 RAM 问题。
我需要找到另一种方法来计算我的距离矩阵。
任何明确的答案都会对我很有帮助。
r - 在 R 中使用 hclust 集群属性
我有一个数据集,它是二维数据,列名作为属性,行作为项目。下面给出一个示例:
……
我已经使用 hclust(ward.D2 方法)在 R 中创建了一个集群树状图。我可以获得集群中所有项目的标签。如何找出集群的属性列表(A1 A2 等),以便推断这些项目是如何组合在一起的?
我尝试过的代码是:
r - R - 在 hclust 中隔离具有特定特征的集群
我已经使用 hclust 生成了一些数据的集群树状图,但我需要隔离所有成对的集群,即仅包含 2 条数据的所有集群(第一个集群在一起的数据),即使它们可能是与“更高”分支上的其他数据聚集在一起。有谁知道我该怎么做?
我在附图中突出显示了我想要隔离的集群,希望这能更好地解释它。
我希望能够以能够比较集群内容的方式隔离这些集群中的所有配对数据。例如查看其中哪些包含特定类型的数据。
r - 聚类可视化/分析的坐标图
我有一个数据集(已经缩放),总共包含 8 列:
- 第一列指示每个观察所属的分配集群,
- 以及 7 个因变量(每个变量在不同的列中)。
我想通过 R 中的坐标图开发聚类可视化,就像下面的博客 ( http://blog.datascienceheroes.com/short-lesson-on-cluster-analysis/ ) 中所示。
谁能帮我解决这个问题?