问题标签 [r-daisy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 中的 Partitioned Around Medoids (PAM) 簇周围绘制多边形/凸包?
再会
是否可以根据 PAM 差异聚类分析的输出生成图,并在聚类的外点周围绘制多边形?
我目前使用函数 clusplot 实现了类似的功能,但是我更感兴趣的是看到使用直线划分的集群。
我知道 ggplot2 中的函数 autoplot 接受 pam 类的对象,但是当尝试将其用于我的数据并将上述 clusplot 函数替换为
或者
autoplot(pam(Koeberg.Diss, diss = TRUE, k = 28), frame = TRUE)
我收到以下错误...
pam(pam_fit) 中的错误:x 不是数字数据框或矩阵。
和
as.data.frame.default(x[[i]], optional = TRUE, stringsAsFactors = stringsAsFactors) 中的错误:无法将类“waiver”分别强制转换为 data.frame...
我对 R 相对较新,并在这些论坛上发布问题,所以任何帮助都将不胜感激。
编辑:使用 factoextra 包中的 fviz_cluster() 让它工作
r - 如何将序数数据输入菊花函数
我有一个包含 12 个变量的数据集,每个变量取值 1 到 4,并被视为序数。如果我没有指定它们的类型,它们将被视为间隔类型
但如果我添加'type=list(ordratio=1:12)',则类型变为'T',我确定它代表什么。如果它不代表序数,那么我如何告诉雏菊我正在输入序数数据?
r - 如何计算属性类别之间具有非统一相似性的数据帧中的行相似性?
通常,我通过 Gower 相似度度量计算数据框中的行相似度,如下所示。
上面我假设所有类别属性(第 2 列和第 3 列)中类别之间的差异是相同的。
但是,如果s
第三个属性的 5 个类别(A、B、C、D、E)之间的非均匀相异矩阵是什么:
在通过 Gower 相似度计算该数据帧的行相似度时,将这条信息合并到一起的最佳方法是什么?
r - cluster 包中的 daisy 函数返回数据错误
我想使用具有 322 个变量和菊花的 59 个可观察量的序数数据 (1,2,3,4),最终导致聚类分析。我在 excel 输入文件 (csv) 上使用下面的脚本。daisy 后,出现以下错误信息:
grb 数据在第一列中包含行名,在第一行中包含列标题。daisy 似乎认为它必须使用第一列:我怎样才能告诉它不这样做?输入数据看起来没问题。
其次,daisy 认为数据是二进制文件,但它们是序数,1-4。如何纠正这个?任何帮助是极大的赞赏。
脚本:
r - 在并行内核上计算相异矩阵
我正在尝试基于大数据框计算相异矩阵。由于我的特征与分类和数字特征混合在一起,我需要使用集群包daisy
中的函数。
知道如何在并行内核中运行它吗?下面是 iris 数据集的示例:
r - 计算大数据的相异矩阵
我正在尝试基于具有数值和分类特征的大数据框计算相异矩阵。当我从集群包daisy
运行该函数时,我收到错误消息:
错误:无法分配大小为 X 的向量。
在我的情况下,X 大约是 800 GB。知道如何处理这个问题吗?此外,如果有人可以帮助我在并行内核中运行该功能,那也很棒。您可以在下面找到计算 iris 数据集上的相异矩阵的函数:
r - 将因子转换为二进制不对称变量类型
我想将一些变量类型R
从因子转换为二进制不对称变量类型。
我使用以下语法成功地将我的一些数据从因子转换为有序因子:mydata[,200] <-as.ordered(mydata[,200])
,但是当我尝试使用类似的方法将它们转换为二进制不对称变量时,我没有成功,并且无法找到有关如何在线或在线执行此操作的任何信息我有的书。我需要将它们指定为不对称,因为我将使用 daisy 函数来查看差异。如果有人能告诉我如何从因子转换为二进制不对称,我将非常感激。
编辑:回答关于不对称与对称变量的问题:二元对称和二元不对称之间的主要区别在于对称变量,两者都具有相同的权重(那个人是男性还是女性),而在不对称变量中一个更重要比另一个。人们是否有共同的特征并不重要,只有他们有共同特征才重要。例如,色盲的人有一些共同点,但非色盲的人则没有。
所以,我要做的是将它设置为基本上 0 = 不重要,1 = 重要。根据我所读到的内容(Kaufmann & Rousseeuw 1990),重要的是要区分这些在做不同时是不对称的。
进一步编辑:我不相信我需要一个虚拟变量,因为它在技术上已经是一个二进制(一切都是 1、0 或 NA) - 我只是不知道如何让 R 将变量更改为非对称二进制变量而不是因素。
r - R中的菊花功能警告
我使用daisy函数计算距离,但遇到以下警告:
我的数据及其类型如下:
为什么这个警告显示我?请帮助我。谢谢
cluster-analysis - 菊花出现“无效类型字符”错误
我有一个混合数据类型(整数、字符和逻辑)的数据框,我试图用菊花进行聚类。
我在用着:
并得到:
希望对此有所帮助。