问题标签 [r-daisy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中缺少数据的聚类分析
所以我花了很多时间试图找到如何做到这一点的答案。到目前为止我找到的唯一答案是:如何在不删除 R 中存在 NA 的行的情况下执行聚类
不幸的是,这对我不起作用。
所以这是我的数据的一个例子(这个例子中的d):
这是我尝试过的:
据我了解,daisy 应该能够处理 NA 值,但是在尝试对结果进行聚类时仍然收到错误消息。
谢谢。
r - 自举树值与 PAST 不同
当我在 RI 中计算自举树时,会得到与使用 PAST 时不同的值(http://folk.uio.no/ohammer/past/)。如何使两个程序的输出匹配?
这是我在 R 中所做的事情(数据如下):
引导程序的典型输出是[1] 100 6 39 27 23 57 53 75 71
,这里是情节(远 LHS 值应该是 100,它以某种方式被裁剪):
我转换数据以将其发送到 PAST,如下所示:
在过去,我打开 tab.txt 文件,使用外群执行多元 -> 集群 -> 使用欧几里得和 100 次引导复制的邻居加入。从过去我得到这个情节:
而且价值观相差很大。我需要用 R 做什么才能使输出与过去的输出匹配?过去是错的吗?
数据:
r - 如何分配大于 2Gb 的向量
当我收到此错误时,我正试图在 R 中执行命令:
有没有办法为 R 分配更多内存?我的是 Windows 上的 64 位 R。谢谢!
r - R中的模糊聚类与调查数据
我有一个调查数据,它有 18.406 行和 247 列。它有太多的李克特量表问题。当然,它有 NA。
我检查了类似的问题,并在该主题中看到了答案:R 中缺少数据的聚类分析但这对我不起作用。
我正在尝试使用模糊聚类方法。作为第一步,我使用“选择”功能对我想要检查的问题的数据进行子集化。现在我的数据具有“整数”值。之后,我尝试使用具有“雏菊”功能的差异矩阵。这允许 NA。在这一步之后,我使用了“fanny”。第一个参数需要相异矩阵 - 或数据框 - 并且在 "fanny" 中,不允许使用 NA。尽管使用 NA 删除行不是我正在寻找的解决方案。
我究竟做错了什么?
干杯,
r - 从 R 中的热图中选择特定对象/行
我有混合数据类型,其中包含我计划应用集群算法的数字和分类属性。
作为第一步,我使用 daisy() 函数和 Gower 距离度量生成了一个距离矩阵。我在 R 中使用热图和 levelplot 函数显示了距离矩阵。
似乎我的数据中的某些对象之间存在很强的相似性,我想检查一些相似/不同的对象,以使自己确信该度量在我的数据上运行良好。
如何从热图中选择相似/不同的对象并将它们链接到原始数据集以便能够评估它们?
这就是我使用 R 绘制热图的方式。IDX 是我的距离矩阵。
r - 菊花聚类分析
我正在尝试使用 RStudio 执行分层聚类分析,方法是使用包daisy
. 这是我的数据集:
我想使用欧几里得距离daisy
,但是当我跑步时
输出不好。使用高尔距离代替欧几里得距离:
警告信息:在 daisy(fuu, metric = c("euclidean"), type = list(ordratio = c(1,:with mixed variables, metric "gower" 自动使用
我该如何解决?
r - 使用 hclus.scree 的肘部方法,错误找不到函数
我找到了几个使用函数“hclus.scree”来使用肘法来识别集群数量的文档。但是,R 找不到 hclus.scree 函数。这是 R 的一个版本吗?我尝试了多个库,但也许我仍然缺少关键的库。
库(集群)DissimDaisy <- daisy(TraitData,metric = “gower”)AveClust <- hclust(DissimDaisy,method = “average”,members = NULL)hclus.scree(AveClust)错误:找不到函数“hclus.scree” "
r - R中的加权欧几里得距离
我想从数据框创建一个具有加权欧几里德距离的距离矩阵。权重将在向量中定义。这是一个例子:
我到处搜索,在 R 中找不到包或解决方案。'cluster'包中的'daisy'函数声称支持加权,但似乎没有应用权重,它只是吐出正则欧几里得。距离。
任何想法堆栈溢出?
r - R - 不同的结果 gower.dist 和 daisy(...,metric="gower")
我想计算两个数据帧的行之间的距离(差异),以便为每个观察找到最近的聚类。因为我有因子和数值变量,所以我使用的是高尔距离。因为我想比较两个数据帧(而不是一个矩阵的行之间的差异),所以 gower.dist 将是我需要的函数。然而,当我实现它时,我意识到结果与我使用 daisy 的 gower 时得到的结果不同,将行绑定在一起并查看感兴趣的相异矩阵的一部分。
我在这里只提供了我的数据样本,但是当我计算所有数据的差异时,gower.dist 经常导致差异为零,尽管相应的行彼此不相等。为什么?不同结果的原因可能是什么?在我看来,daisys 的 gower 工作正常,而 gower.dist 不是(在这个例子中)。
有以下数据
谢谢!
编辑:似乎出现错误/差异是因为数字列中有 NA 并且它们似乎被不同地对待。如何使 daisy 对 NA 的处理适应 gower.dist?