问题标签 [mclust]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
336 浏览

r - 聚类,Mclust(),提取聚类 - R

我正在使用mclust::Mclust()函数来聚类一个小数据集。但是,我正在努力为每个数据提取聚类分类以放入数据集中。

这是数据:

聚类:

现在,当我运行plot(d_clust)它时,它会显示所有图表和所有内容。但它没有告诉我哪个集群对应于每一行。我查看了文档和其他文档(1 , 2 , 3)以及与Mclust()( 1 , 2 ) 相关的 stackoverflow 问题并不能满足我的问题。

我正在寻找这样的东西:

顺便说一句,当我做class(d_clust)的是一个Mclust类。d_clust如果你d_clust单独运行它没有给你一个表格/数据框来绘制,怎么可能绘制?

0 投票
2 回答
38 浏览

r - 从 mclust 包计算 AWE

是否可以根据通过 mclust R 包获得的信息计算近似证据权重 (AWE)?

0 投票
1 回答
35 浏览

r - 将具有 row.names 的值的数字列表对象添加到没有 row.names 的相同长度的数据框中

我已经使用 mclust 包在一个非缺失数据帧上执行了一个操作。非缺失数据框是使用 dplyr 包通过 select 函数创建的。因此,row.names 在传递给 mclust 函数的数据框中显示为一个向量。

接下来我从这个函数中提取了一些关键值(案例“分类”):

因此,分类值的数字列表与 row.names 相关联。

当我尝试将此值列表附加到没有 row.names 的相同长度(相同情况)的新数据帧时,我似乎失去了重要的排序。我知道这一点,因为当我比较新数据框中其他变量的分类组时,它们不等于使用这些相同变量在 mclust 函数中获得的值。

我不能简单地附加到 mclust 函数中使用的非缺失数据框(带有 row.names)的原因是,我需要函数中未使用的数据集中的其他变量,并且需要在 ID 变量上合并为:

所以我最终得到了一个长度相同但不再有 row.names 的数据框,我想在上面添加来自上述 mclust 函数的分类值。虽然我使用时没有抛出错误:

数据已关闭,因为我可以看到对相关变量的组(类)手段的检查不等于 mclust 函数中的那些(它们应该是相同的核心输入数据)。

我意识到我在这里遗漏了一些明显的东西,但是尽管对档案进行了详尽的搜索,但我还没有找到答案。进行这种相当乏味的争论的正确方法是什么?

0 投票
0 回答
38 浏览

r - 对 .mat 文件中的数据使用 mclust

我是 R 新手,我正在尝试使用 mclust 包。

我需要做的是从data.mat文件中获取数据并使用 mclust 对其进行聚类。

我使用的代码是:

我收到以下错误:

拟合...
|
| mvnX 中的 0% 错误(数据 = 数据,之前 = 之前):(
列表)对象不能被强制输入“双精度”

我已经测试过summary(data['X']),数据是数字的

长度类模式
X 29000000 -none- numeric

我试过使用as.matrix(data['X']),我得到了同样的错误。
我尝试了不同的方法modelName,但我得到了同样的错误。

当然我错过了一些东西,帮助我:(

0 投票
0 回答
134 浏览

r - grid.Call.graphics 中的错误(C_polygon,x$x,x$y,index):“cluster”(包 Mclust)中的颜色名称无效

我将 mclust 包中的基于模型的聚类用于我的数据集的一个子集。MClust 推荐 1 个集群。图形显示中显示以下错误:

错误消息:grid.Call.graphics 中的错误(C_polygon,x$x,x$y,索引):'cluster' 中的颜色名称无效

这是我的数据集的一部分:

0 投票
2 回答
309 浏览

r - 安装 mclust 包问题。安装正在准备延迟加载并且永远不会完成

在 Ubuntu 20.04 上加载 R 4.0.0 后。

并加载了以下软件包:

我尝试安装包mclust,而 R 在准备延迟加载时卡住了。

我等了一夜,但安装仍然卡在同一点。有谁知道如何解决这个问题?

我已经安装了不同的软件包,没有任何问题。这是已安装在我的库目录中的软件包的完整列表:

0 投票
0 回答
65 浏览

r - 如何修复“row.names 重复”错误 R 包 TidyLPA/mclust

我是 R 的初学者,所以如果这是一个愚蠢的问题,请多多包涵。

我正在尝试使用 mclust 包的 TidyLPA 包装器在 R 中运行潜在配置文件分析 (LPA)。我的数据框加载到 R 中没有问题/错误消息,我已经仔细检查以确保数据正确加载。每当我运行 LPA 时,我都会收到以下警告消息"In data.row.names(row.names, rowsi, i) : some row.names duplicated: 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28 --> row.names NOT used"

我已经尝试了在其他线程上提出的一些建议,例如检查anyDuplicated(row.names(mydataframe))- 它告诉我没有重复的行名 - 或者make.names(mydataframe, unique=TRUE- 这不能解决问题。我不确定问题出在我的数据(我已经检查过重复的行名)还是我的代码中。抱歉,如果有一个明显的答案,我真的需要一些帮助才能让这段代码正常运行。

完整代码复制如下。

非常感谢您提供的任何帮助!

0 投票
1 回答
114 浏览

r - 从模型输出中收集信息的简单方法

考虑这个数据框:

我正在使用 mclust 包来拟合混合模型并获得自举标准错误,如下所示:

接下来我想创建一个新的数据框来显示每个观察的混合概率,所以我将原始数据dat1mod$z.

现在我要收集:1)每个集群中每个变量的平均值,以及 2)每个平均值的标准误差(来自summary(boot, what = "SE")$mean)。我将使用这些来创建下面的图,并返回一个显示平均值和 SE 值的表。

最终,我想编写一个函数来执行每个步骤并立即返回输出。它将应用于结构类似于 的数据帧dat1,但它们的var列数不同。我还需要指定要使用的集群数量以及创建时要使用的模型mod。有什么更好的方法来收集存储在其中的信息,a以便可以将相同的过程应用于函数内的变量(var.列)和混合成分(G在 中指定mod)的任何组合?

0 投票
1 回答
24 浏览

r - 在 Ubuntu v20.04 上的 R v4.0.1 上安装 mclust 包 v5.4.6 挂起

在 Ubuntu 20.04 上使用 R 4.0.1 执行 'Rscript -e "install.packages('mclust')"` 后,该过程在包准备期间挂起。知道如何解决或调试此问题吗?

环境: R v4.0.1、GCC v9、Ubuntu v20.04

CMD: Rscript -e "install.packages('mclust')"

0 投票
1 回答
57 浏览

r - 集群不包含观测值

我使用 Mclust / GMM 在生产中实施了集群解决方案。该算法在初始数据上运行,解决方案将应用于看不见的数据(predict.Mclust)。它工作得很好,现在当我使用相同的种子对相同的数据运行函数时,它给了我一个不同的解决方案。有没有观察到的集群。这怎么可能发生?我真的很感谢你的帮助。先感谢您。如果您需要更多详细信息,请告诉我

输出