问题标签 [r-daisy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
7211 浏览

r - R中缺少数据的聚类分析

所以我花了很多时间试图找到如何做到这一点的答案。到目前为止我找到的唯一答案是:如何在不删除 R 中存在 NA 的行的情况下执行聚类

不幸的是,这对我不起作用。

所以这是我的数据的一个例子(这个例子中的d):

这是我尝试过的:

据我了解,daisy 应该能够处理 NA 值,但是在尝试对结果进行聚类时仍然收到错误消息。

谢谢。

0 投票
1 回答
408 浏览

r - 自举树值与 PAST 不同

当我在 RI 中计算自举树时,会得到与使用 PAST 时不同的值(http://folk.uio.no/ohammer/past/)。如何使两个程序的输出匹配?

这是我在 R 中所做的事情(数据如下):

引导程序的典型输出是[1] 100 6 39 27 23 57 53 75 71,这里是情节(远 LHS 值应该是 100,它以某种方式被裁剪):

在此处输入图像描述

我转换数据以将其发送到 PAST,如下所示:

在过去,我打开 tab.txt 文件,使用外群执行多元 -> 集群 -> 使用欧几里得和 100 次引导复制的邻居加入。从过去我得到这个情节:

在此处输入图像描述

而且价值观相差很大。我需要用 R 做什么才能使输出与过去的输出匹配?过去是错的吗?

数据:

0 投票
0 回答
530 浏览

r - 如何分配大于 2Gb 的向量

当我收到此错误时,我正试图在 R 中执行命令:

有没有办法为 R 分配更多内存?我的是 Windows 上的 64 位 R。谢谢!

0 投票
0 回答
517 浏览

r - R中的模糊聚类与调查数据

我有一个调查数据,它有 18.406 行和 247 列。它有太多的李克特量表问题。当然,它有 NA。

我检查了类似的问题,并在该主题中看到了答案:R 中缺少数据的聚类分析但这对我不起作用。

我正在尝试使用模糊聚类方法。作为第一步,我使用“选择”功能对我想要检查的问题的数据进行子集化。现在我的数据具有“整数”值。之后,我尝试使用具有“雏菊”功能的差异矩阵。这允许 NA。在这一步之后,我使用了“fanny”。第一个参数需要相异矩阵 - 或数据框 - 并且在 "fanny" 中,不允许使用 NA。尽管使用 NA 删除行不是我正在寻找的解决方案。

我究竟做错了什么?

干杯,

0 投票
0 回答
528 浏览

r - 从 R 中的热图中选择特定对象/行

我有混合数据类型,其中包含我计划应用集群算法的数字和分类属性。

作为第一步,我使用 daisy() 函数和 Gower 距离度量生成了一个距离矩阵。我在 R 中使用热图和 levelplot 函数显示了距离矩阵。

似乎我的数据中的某些对象之间存在很强的相似性,我想检查一些相似/不同的对象,以使自己确信该度量在我的数据上运行良好。

如何从热图中选择相似/不同的对象并将它们链接到原始数据集以便能够评估它们?

这就是我使用 R 绘制热图的方式。IDX 是我的距离矩阵。

0 投票
1 回答
2778 浏览

r - 使用相异矩阵 R 的层次聚类

我有包含数字和分类属性的混合数据类型矩阵Data_string大小 (947 x 41)。

我使用 daisy() 函数和 Rstudio 中的 Gower 距离测量生成了一个距离矩阵 (947 x 947)。

我使用相异矩阵 (d) 应用了层次聚类。

以下是我的地块。

戴安娜情节

hclust_plot

** 注意:由于我没有足够的声望点,我无法在此处上传图片。

我正在努力理解结果,任何人都可以请

1-建议我可以在 R 中应用的任何解决方案,以简化对我的结果的理解。

或者

2-我如何将它链接到我的源数据,因为所有结果都基于相异矩阵。

0 投票
1 回答
3593 浏览

r - 菊花聚类分析

我正在尝试使用 RStudio 执行分层聚类分析,方法是使用包daisy. 这是我的数据集:

我想使用欧几里得距离daisy,但是当我跑步时

输出不好。使用高尔距离代替欧几里得距离:

警告信息:在 daisy(fuu, metric = c("euclidean"), type = list(ordratio = c(1,:with mixed variables, metric "gower" 自动使用

我该如何解决?

0 投票
0 回答
183 浏览

r - 使用 hclus.scree 的肘部方法,错误找不到函数

我找到了几个使用函数“hclus.scree”来使用肘法来识别集群数量的文档。但是,R 找不到 hclus.scree 函数。这是 R 的一个版本吗?我尝试了多个库,但也许我仍然缺少关键的库。

库(集群)DissimDaisy <- daisy(TraitData,metric = “gower”)AveClust <- hclust(DissimDaisy,method = “average”,members = NULL)hclus.scree(AveClust)错误:找不到函数“hclus.scree” "

0 投票
1 回答
5088 浏览

r - R中的加权欧几里得距离

我想从数据框创建一个具有加权欧几里德距离的距离矩阵。权重将在向量中定义。这是一个例子:

我到处搜索,在 R 中找不到包或解决方案。'cluster'包中的'daisy'函数声称支持加权,但似乎没有应用权重,它只是吐出正则欧几里得。距离。

任何想法堆栈溢出?

0 投票
1 回答
2425 浏览

r - R - 不同的结果 gower.dist 和 daisy(...,metric="gower")

我想计算两个数据帧的行之间的距离(差异),以便为每个观察找到最近的聚类。因为我有因子和数值变量,所以我使用的是高尔距离。因为我想比较两个数据帧(而不是一个矩阵的行之间的差异),所以 gower.dist 将是我需要的函数。然而,当我实现它时,我意识到结果与我使用 daisy 的 gower 时得到的结果不同,将行绑定在一起并查看感兴趣的相异矩阵的一部分。

我在这里只提供了我的数据样本,但是当我计算所有数据的差异时,gower.dist 经常导致差异为零,尽管相应的行彼此不相等。为什么?不同结果的原因可能是什么?在我看来,daisys 的 gower 工作正常,而 gower.dist 不是(在这个例子中)。

有以下数据

谢谢!

编辑:似乎出现错误/差异是因为数字列中有 NA 并且它们似乎被不同地对待。如何使 daisy 对 NA 的处理适应 gower.dist?