问题标签 [r-daisy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
538 浏览

r - 如何在 R 中的 Partitioned Around Medoids (PAM) 簇周围绘制多边形/凸包?

再会

是否可以根据 PAM 差异聚类分析的输出生成图,并在聚类的外点周围绘制多边形?

我目前使用函数 clusplot 实现了类似的功能,但是我更感兴趣的是看到使用直线划分的集群。

我知道 ggplot2 中的函数 autoplot 接受 pam 类的对象,但是当尝试将其用于我的数据并将上述 clusplot 函数替换为

或者

autoplot(pam(Koeberg.Diss, diss = TRUE, k = 28), frame = TRUE)

我收到以下错误...

pam(pam_fit) 中的错误:x 不是数字数据框或矩阵。

as.data.frame.default(x[[i]], optional = TRUE, stringsAsFactors = stringsAsFactors) 中的错误:无法将类“waiver”分别强制转换为 data.frame...

我对 R 相对较新,并在这些论坛上发布问题,所以任何帮助都将不胜感激。

编辑:使用 factoextra 包中的 fviz_cluster() 让它工作

0 投票
1 回答
662 浏览

r - 如何将序数数据输入菊花函数

我有一个包含 12 个变量的数据集,每个变量取值 1 到 4,并被视为序数。如果我没有指定它们的类型,它们将被视为间隔类型

但如果我添加'type=list(ordratio=1:12)',则类型变为'T',我确定它代表什么。如果它不代表序数,那么我如何告诉雏菊我正在输入序数数据?

0 投票
1 回答
318 浏览

r - 如何计算属性类别之间具有非统一相似性的数据帧中的行相似性?

通常,我通过 Gower 相似度度量计算数据框中的行相似度,如下所示。

上面我假设所有类别属性(第 2 列和第 3 列)中类别之间的差异是相同的。

但是,如果s第三个属性的 5 个类别(A、B、C、D、E)之间的非均匀相异矩阵是什么:

在通过 Gower 相似度计算该数据帧的行相似度时,将这条信息合并到一起的最佳方法是什么?

0 投票
1 回答
1375 浏览

r - X轴标签未显示在ggplot的聚类树状图中

我按照我在网上找到的先前代码做了一个聚类树状图,但是图中没有显示 x 轴。我想在 x 轴上显示差异值,但我没有成功。

这是我的树状图的样子:

在此处输入图像描述

0 投票
0 回答
405 浏览

r - cluster 包中的 daisy 函数返回数据错误

我想使用具有 322 个变量和菊花的 59 个可观察量的序数数据 (1,2,3,4),最终导致聚类分析。我在 excel 输入文件 (csv) 上使用下面的脚本。daisy 后,出现以下错误信息:

grb 数据在第一列中包含行名,在第一行中包含列标题。daisy 似乎认为它必须使用第一列:我怎样才能告诉它不这样做?输入数据看起来没问题。

其次,daisy 认为数据是二进制文件,但它们是序数,1-4。如何纠正这个?任何帮助是极大的赞赏。

脚本:

0 投票
0 回答
72 浏览

r - 在并行内核上计算相异矩阵

我正在尝试基于大数据框计算相异矩阵。由于我的特征与分类和数字特征混合在一起,我需要使用集群包daisy中的函数。

知道如何在并行内核中运行它吗?下面是 iris 数据集的示例:

0 投票
1 回答
1253 浏览

r - 计算大数据的相异矩阵

我正在尝试基于具有数值和分类特征的大数据框计算相异矩阵。当我从集群包daisy运行该函数时,我收到错误消息:

错误:无法分配大小为 X 的向量。

在我的情况下,X 大约是 800 GB。知道如何处理这个问题吗?此外,如果有人可以帮助我在并行内核中运行该功能,那也很棒。您可以在下面找到计算 iris 数据集上的相异矩阵的函数:

0 投票
2 回答
450 浏览

r - 将因子转换为二进制不对称变量类型

我想将一些变量类型R从因子转换为二进制不对称变量类型。

我使用以下语法成功地将我的一些数据从因子转换为有序因子:mydata[,200] <-as.ordered(mydata[,200]),但是当我尝试使用类似的方法将它们转换为二进制不对称变量时,我没有成功,并且无法找到有关如何在线或在线执行此操作的任何信息我有的书。我需要将它们指定为不对称,因为我将使用 daisy 函数来查看差异。如果有人能告诉我如何从因子转换为二进制不对称,我将非常感激。

编辑:回答关于不对称与对称变量的问题:二元对称和二元不对称之间的主要区别在于对称变量,两者都具有相同的权重(那个人是男性还是女性),而在不对称变量中一个更重要比另一个。人们是否有共同的特征并不重要只有他们共同特征才重要。例如,色盲的人有一些共同点,但非色盲的人则没有。

所以,我要做的是将它设置为基本上 0 = 不重要,1 = 重要。根据我所读到的内容(Kaufmann & Rousseeuw 1990),重要的是要区分这些在做不同时是不对称的。

进一步编辑:我不相信我需要一个虚拟变量,因为它在技术上已经是一个二进制(一切都是 1、0 或 NA) - 我只是不知道如何让 R 将变量更改为非对称二进制变量而不是因素。

0 投票
0 回答
632 浏览

r - R中的菊花功能警告

我使用daisy函数计算距离,但遇到以下警告:

我的数据及其类型如下:

为什么这个警告显示我?请帮助我。谢谢

0 投票
1 回答
4137 浏览

cluster-analysis - 菊花出现“无效类型字符”错误

我有一个混合数据类型(整数、字符和逻辑)的数据框,我试图用菊花进行聚类。

我在用着:

并得到:

希望对此有所帮助。