“r-daisy”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

7211 浏览

r - R中缺少数据的聚类分析

所以我花了很多时间试图找到如何做到这一点的答案。到目前为止我找到的唯一答案是：如何在不删除 R 中存在 NA 的行的情况下执行聚类

不幸的是，这对我不起作用。

所以这是我的数据的一个例子（这个例子中的d）：

这是我尝试过的：

据我了解，daisy 应该能够处理 NA 值，但是在尝试对结果进行聚类时仍然收到错误消息。

谢谢。

r cluster-analysis r-daisy

2014-11-12T18:53:46.150

0 投票

1 回答

408 浏览

r - 自举树值与 PAST 不同

当我在 RI 中计算自举树时，会得到与使用 PAST 时不同的值（http://folk.uio.no/ohammer/past/）。如何使两个程序的输出匹配？

这是我在 R 中所做的事情（数据如下）：

引导程序的典型输出是[1] 100 6 39 27 23 57 53 75 71，这里是情节（远 LHS 值应该是 100，它以某种方式被裁剪）：

在此处输入图像描述

我转换数据以将其发送到 PAST，如下所示：

在过去，我打开 tab.txt 文件，使用外群执行多元 -> 集群 -> 使用欧几里得和 100 次引导复制的邻居加入。从过去我得到这个情节：

在此处输入图像描述

而且价值观相差很大。我需要用 R 做什么才能使输出与过去的输出匹配？过去是错的吗？

数据：

r phylogeny r-daisy

2014-12-17T13:19:18.970

0 投票

0 回答

530 浏览

r - 如何分配大于 2Gb 的向量

当我收到此错误时，我正试图在 R 中执行命令：

有没有办法为 R 分配更多内存？我的是 Windows 上的 64 位 R。谢谢！

r memory limit r-daisy

2015-06-24T10:16:19.400

0 投票

0 回答

517 浏览

r - R中的模糊聚类与调查数据

我有一个调查数据，它有 18.406 行和 247 列。它有太多的李克特量表问题。当然，它有 NA。

我检查了类似的问题，并在该主题中看到了答案：R 中缺少数据的聚类分析但这对我不起作用。

我正在尝试使用模糊聚类方法。作为第一步，我使用“选择”功能对我想要检查的问题的数据进行子集化。现在我的数据具有“整数”值。之后，我尝试使用具有“雏菊”功能的差异矩阵。这允许 NA。在这一步之后，我使用了“fanny”。第一个参数需要相异矩阵 - 或数据框 - 并且在 "fanny" 中，不允许使用 NA。尽管使用 NA 删除行不是我正在寻找的解决方案。

我究竟做错了什么？

干杯，

r survey fuzzy r-daisy

2015-08-09T16:28:00.210

0 投票

0 回答

528 浏览

r - 从 R 中的热图中选择特定对象/行

我有混合数据类型，其中包含我计划应用集群算法的数字和分类属性。

作为第一步，我使用 daisy() 函数和 Gower 距离度量生成了一个距离矩阵。我在 R 中使用热图和 levelplot 函数显示了距离矩阵。

似乎我的数据中的某些对象之间存在很强的相似性，我想检查一些相似/不同的对象，以使自己确信该度量在我的数据上运行良好。

如何从热图中选择相似/不同的对象并将它们链接到原始数据集以便能够评估它们？

这就是我使用 R 绘制热图的方式。IDX 是我的距离矩阵。

r cluster-analysis heatmap r-daisy

2015-09-08T20:49:40.210

0 投票

1 回答

2778 浏览

r - 使用相异矩阵 R 的层次聚类

我有包含数字和分类属性的混合数据类型矩阵Data_string大小 (947 x 41)。

我使用 daisy() 函数和 Rstudio 中的 Gower 距离测量生成了一个距离矩阵 (947 x 947)。

我使用相异矩阵 (d) 应用了层次聚类。

以下是我的地块。

** 注意：由于我没有足够的声望点，我无法在此处上传图片。

我正在努力理解结果，任何人都可以请

1-建议我可以在 R 中应用的任何解决方案，以简化对我的结果的理解。

或者

2-我如何将它链接到我的源数据，因为所有结果都基于相异矩阵。

r distance hierarchical-clustering r-daisy

2015-09-17T15:02:58.650

0 投票

1 回答

3593 浏览

r - 菊花聚类分析

我正在尝试使用 RStudio 执行分层聚类分析，方法是使用包daisy. 这是我的数据集：

我想使用欧几里得距离daisy，但是当我跑步时

输出不好。使用高尔距离代替欧几里得距离：

警告信息：在 daisy(fuu, metric = c("euclidean"), type = list(ordratio = c(1,:with mixed variables, metric "gower" 自动使用

我该如何解决？

r cluster-computing analysis r-daisy

2016-02-10T22:12:16.043

0 投票

0 回答

183 浏览

r - 使用 hclus.scree 的肘部方法，错误找不到函数

我找到了几个使用函数“hclus.scree”来使用肘法来识别集群数量的文档。但是，R 找不到 hclus.scree 函数。这是 R 的一个版本吗？我尝试了多个库，但也许我仍然缺少关键的库。

库（集群）DissimDaisy <- daisy（TraitData，metric = “gower”）AveClust <- hclust（DissimDaisy，method = “average”，members = NULL）hclus.scree（AveClust）错误：找不到函数“hclus.scree” "

r r-daisy

2016-02-18T18:10:28.000

0 投票

1 回答

5088 浏览

r - R中的加权欧几里得距离

我想从数据框创建一个具有加权欧几里德距离的距离矩阵。权重将在向量中定义。这是一个例子：

我到处搜索，在 R 中找不到包或解决方案。'cluster'包中的'daisy'函数声称支持加权，但似乎没有应用权重，它只是吐出正则欧几里得。距离。

任何想法堆栈溢出？

r cluster-analysis euclidean-distance r-daisy

2016-08-30T20:35:35.967

0 投票

1 回答

2425 浏览

r - R - 不同的结果 gower.dist 和 daisy(...,metric="gower")

我想计算两个数据帧的行之间的距离（差异），以便为每个观察找到最近的聚类。因为我有因子和数值变量，所以我使用的是高尔距离。因为我想比较两个数据帧（而不是一个矩阵的行之间的差异），所以 gower.dist 将是我需要的函数。然而，当我实现它时，我意识到结果与我使用 daisy 的 gower 时得到的结果不同，将行绑定在一起并查看感兴趣的相异矩阵的一部分。

我在这里只提供了我的数据样本，但是当我计算所有数据的差异时，gower.dist 经常导致差异为零，尽管相应的行彼此不相等。为什么？不同结果的原因可能是什么？在我看来，daisys 的 gower 工作正常，而 gower.dist 不是（在这个例子中）。

有以下数据

谢谢！

编辑：似乎出现错误/差异是因为数字列中有 NA 并且它们似乎被不同地对待。如何使 daisy 对 NA 的处理适应 gower.dist？

r machine-learning distance data-mining r-daisy

2016-10-26T14:21:14.023

问题标签 [r-daisy]

Reference