1

我有一个数据框 S=[rows x cols] 包含样本 s,这样行名告诉样本的名称,列名告诉各个样本的特征。在这个数据框中,我插入了一个测试样本 t1。现在我想提取与 t1 相似或孪生的特定样本“s”的名称和值。为此,我使用了 heatmaply() 来绘制层次聚类。观察这个图,我可以看到在第 1 阶段(迭代层次聚类过程)创建的集群只包含两个成员,一个是我的测试样本 t1,另一个成员是它的几乎双胞胎或几乎相似的样本。现在我只想从第 1 阶段制作的集群中提取与我的测试样本 t1 相似的孪生或样本 s,仅此而已。请在这方面指导我。

我对 hclust 和 dist 函数略知一二。dist 的问题在于它提供了太多信息,我想不出如何从 dist 矩阵中提取我的测试样本 t1 的孪生。我对 cutree() 有一点了解。据我所知,我认为它可以给出成员所属的集群,具体取决于参数 k 的值。因此,当 k 的值发生变化时,集群的成员也会发生变化。我想知道我是否可以利用 cutree 来获得第一阶段的集群(包含两个成员)并找到与我的测试样本 t1 相似的成员。hclust 对象的值让我特别感兴趣。例如合并和排序。也许有人可以指导我更多关于它的信息,我可以用它们来获得双胞胎

我很抱歉这篇长文。我试图以简洁的方式尽可能清楚地解释,并想表明我已经尝试了我的知识,但非常感谢您的经验来解决这个问题。

4

0 回答 0