问题标签 [r-daisy]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

40 问题

0 投票

1 回答

538 浏览

r - 如何在 R 中的 Partitioned Around Medoids (PAM) 簇周围绘制多边形/凸包？

再会

是否可以根据 PAM 差异聚类分析的输出生成图，并在聚类的外点周围绘制多边形？

我目前使用函数 clusplot 实现了类似的功能，但是我更感兴趣的是看到使用直线划分的集群。

我知道 ggplot2 中的函数 autoplot 接受 pam 类的对象，但是当尝试将其用于我的数据并将上述 clusplot 函数替换为

或者

autoplot(pam(Koeberg.Diss, diss = TRUE, k = 28), frame = TRUE)

我收到以下错误...

pam(pam_fit) 中的错误：x 不是数字数据框或矩阵。

和

as.data.frame.default(x[[i]], optional = TRUE, stringsAsFactors = stringsAsFactors) 中的错误：无法将类“waiver”分别强制转换为 data.frame...

我对 R 相对较新，并在这些论坛上发布问题，所以任何帮助都将不胜感激。

编辑：使用 factoextra 包中的 fviz_cluster() 让它工作

r cluster-analysis convex-hull r-daisy

2017-05-15T23:28:00.497

0 投票

1 回答

662 浏览

r - 如何将序数数据输入菊花函数

我有一个包含 12 个变量的数据集，每个变量取值 1 到 4，并被视为序数。如果我没有指定它们的类型，它们将被视为间隔类型

但如果我添加'type=list(ordratio=1:12)'，则类型变为'T'，我确定它代表什么。如果它不代表序数，那么我如何告诉雏菊我正在输入序数数据？

r r-daisy

2017-08-19T08:18:42.823

0 投票

1 回答

318 浏览

r - 如何计算属性类别之间具有非统一相似性的数据帧中的行相似性？

通常，我通过 Gower 相似度度量计算数据框中的行相似度，如下所示。

上面我假设所有类别属性（第 2 列和第 3 列）中类别之间的差异是相同的。

但是，如果s第三个属性的 5 个类别（A、B、C、D、E）之间的非均匀相异矩阵是什么：

在通过 Gower 相似度计算该数据帧的行相似度时，将这条信息合并到一起的最佳方法是什么？

r machine-learning cluster-analysis similarity r-daisy

2017-09-12T01:27:07.590

0 投票

1 回答

1375 浏览

r - X轴标签未显示在ggplot的聚类树状图中

我按照我在网上找到的先前代码做了一个聚类树状图，但是图中没有显示 x 轴。我想在 x 轴上显示差异值，但我没有成功。

这是我的树状图的样子：

r ggplot2 dendrogram r-daisy

2017-09-12T12:36:39.827

0 投票

0 回答

405 浏览

r - cluster 包中的 daisy 函数返回数据错误

我想使用具有 322 个变量和菊花的 59 个可观察量的序数数据 (1,2,3,4)，最终导致聚类分析。我在 excel 输入文件 (csv) 上使用下面的脚本。daisy 后，出现以下错误信息：

grb 数据在第一列中包含行名，在第一行中包含列标题。daisy 似乎认为它必须使用第一列：我怎样才能告诉它不这样做？输入数据看起来没问题。

其次，daisy 认为数据是二进制文件，但它们是序数，1-4。如何纠正这个？任何帮助是极大的赞赏。

脚本：

r r-daisy factoextra

2017-11-12T14:48:53.067

0 投票

0 回答

72 浏览

r - 在并行内核上计算相异矩阵

我正在尝试基于大数据框计算相异矩阵。由于我的特征与分类和数字特征混合在一起，我需要使用集群包daisy中的函数。

知道如何在并行内核中运行它吗？下面是 iris 数据集的示例：

r parallel-processing r-daisy

2017-11-30T10:19:28.307

0 投票

1 回答

1253 浏览

r - 计算大数据的相异矩阵

我正在尝试基于具有数值和分类特征的大数据框计算相异矩阵。当我从集群包daisy运行该函数时，我收到错误消息：

错误：无法分配大小为 X 的向量。

在我的情况下，X 大约是 800 GB。知道如何处理这个问题吗？此外，如果有人可以帮助我在并行内核中运行该功能，那也很棒。您可以在下面找到计算 iris 数据集上的相异矩阵的函数：

r cluster-computing r-daisy

2017-12-01T09:29:04.537

0 投票

2 回答

450 浏览

r - 将因子转换为二进制不对称变量类型

我想将一些变量类型R从因子转换为二进制不对称变量类型。

我使用以下语法成功地将我的一些数据从因子转换为有序因子：mydata[,200] <-as.ordered(mydata[,200])，但是当我尝试使用类似的方法将它们转换为二进制不对称变量时，我没有成功，并且无法找到有关如何在线或在线执行此操作的任何信息我有的书。我需要将它们指定为不对称，因为我将使用 daisy 函数来查看差异。如果有人能告诉我如何从因子转换为二进制不对称，我将非常感激。

编辑：回答关于不对称与对称变量的问题：二元对称和二元不对称之间的主要区别在于对称变量，两者都具有相同的权重（那个人是男性还是女性），而在不对称变量中一个更重要比另一个。人们是否有共同的特征并不重要，只有他们有共同特征才重要。例如，色盲的人有一些共同点，但非色盲的人则没有。

所以，我要做的是将它设置为基本上 0 = 不重要，1 = 重要。根据我所读到的内容（Kaufmann & Rousseeuw 1990），重要的是要区分这些在做不同时是不对称的。

进一步编辑：我不相信我需要一个虚拟变量，因为它在技术上已经是一个二进制（一切都是 1、0 或 NA） - 我只是不知道如何让 R 将变量更改为非对称二进制变量而不是因素。

r binary-data asymmetric r-daisy

2018-04-26T16:09:12.957

0 投票

0 回答

632 浏览

r - R中的菊花功能警告

我使用daisy函数计算距离，但遇到以下警告：

我的数据及其类型如下：

为什么这个警告显示我？请帮助我。谢谢

r warnings r-daisy

2018-06-06T13:36:25.200

0 投票

1 回答

4137 浏览

cluster-analysis - 菊花出现“无效类型字符”错误

我有一个混合数据类型（整数、字符和逻辑）的数据框，我试图用菊花进行聚类。

我在用着：

并得到：

希望对此有所帮助。

cluster-analysis r-daisy

2018-09-26T17:11:51.407

1 2 3 4 5 6 7 8 9 10

问题标签 [r-daisy]

Reference