“mclust”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

336 浏览

r - 聚类，Mclust()，提取聚类 - R

我正在使用mclust::Mclust()函数来聚类一个小数据集。但是，我正在努力为每个数据提取聚类分类以放入数据集中。

这是数据：

聚类：

现在，当我运行plot(d_clust)它时，它会显示所有图表和所有内容。但它没有告诉我哪个集群对应于每一行。我查看了文档和其他文档（1 , 2 , 3）以及与Mclust()( 1 , 2 ) 相关的 stackoverflow 问题并不能满足我的问题。

我正在寻找这样的东西：

顺便说一句，当我做class(d_clust)的是一个Mclust类。d_clust如果你d_clust单独运行它没有给你一个表格/数据框来绘制，怎么可能绘制？

r cluster-analysis k-means mclust

2019-11-18T23:59:58.220

0 投票

2 回答

38 浏览

r - 从 mclust 包计算 AWE

是否可以根据通过 mclust R 包获得的信息计算近似证据权重 (AWE)？

r mclust

2019-12-08T17:24:25.947

0 投票

1 回答

35 浏览

r - 将具有 row.names 的值的数字列表对象添加到没有 row.names 的相同长度的数据框中

我已经使用 mclust 包在一个非缺失数据帧上执行了一个操作。非缺失数据框是使用 dplyr 包通过 select 函数创建的。因此，row.names 在传递给 mclust 函数的数据框中显示为一个向量。

接下来我从这个函数中提取了一些关键值（案例“分类”）：

因此，分类值的数字列表与 row.names 相关联。

当我尝试将此值列表附加到没有 row.names 的相同长度（相同情况）的新数据帧时，我似乎失去了重要的排序。我知道这一点，因为当我比较新数据框中其他变量的分类组时，它们不等于使用这些相同变量在 mclust 函数中获得的值。

我不能简单地附加到 mclust 函数中使用的非缺失数据框（带有 row.names）的原因是，我需要函数中未使用的数据集中的其他变量，并且需要在 ID 变量上合并为：

所以我最终得到了一个长度相同但不再有 row.names 的数据框，我想在上面添加来自上述 mclust 函数的分类值。虽然我使用时没有抛出错误：

数据已关闭，因为我可以看到对相关变量的组（类）手段的检查不等于 mclust 函数中的那些（它们应该是相同的核心输入数据）。

我意识到我在这里遗漏了一些明显的东西，但是尽管对档案进行了详尽的搜索，但我还没有找到答案。进行这种相当乏味的争论的正确方法是什么？

r dataframe dplyr cbind mclust

2020-01-12T08:53:43.920

0 投票

0 回答

38 浏览

r - 对 .mat 文件中的数据使用 mclust

我是 R 新手，我正在尝试使用 mclust 包。

我需要做的是从data.mat文件中获取数据并使用 mclust 对其进行聚类。

我使用的代码是：

我收到以下错误：

拟合...
|
| mvnX 中的 0% 错误（数据 = 数据，之前 = 之前）：（
列表）对象不能被强制输入“双精度”

我已经测试过summary(data['X'])，数据是数字的

长度类模式
X 29000000 -none- numeric

我试过使用as.matrix(data['X'])，我得到了同样的错误。
我尝试了不同的方法modelName，但我得到了同样的错误。

当然我错过了一些东西，帮助我:(

r mclust

2020-02-10T11:56:23.740

0 投票

0 回答

134 浏览

r - grid.Call.graphics 中的错误（C_polygon，x$x，x$y，index）：“cluster”（包 Mclust）中的颜色名称无效

我将 mclust 包中的基于模型的聚类用于我的数据集的一个子集。MClust 推荐 1 个集群。图形显示中显示以下错误：

错误消息：grid.Call.graphics 中的错误（C_polygon，x$x，x$y，索引）：'cluster' 中的颜色名称无效

这是我的数据集的一部分：

r graph cluster-analysis mclust

2020-04-01T08:50:33.613

0 投票

2 回答

309 浏览

r - 安装 mclust 包问题。安装正在准备延迟加载并且永远不会完成

在 Ubuntu 20.04 上加载 R 4.0.0 后。

并加载了以下软件包：

我尝试安装包mclust，而 R 在准备延迟加载时卡住了。

我等了一夜，但安装仍然卡在同一点。有谁知道如何解决这个问题？

我已经安装了不同的软件包，没有任何问题。这是已安装在我的库目录中的软件包的完整列表：

r ubuntu installation-package mclust

2020-06-04T08:45:53.413

0 投票

0 回答

65 浏览

r - 如何修复“row.names 重复”错误 R 包 TidyLPA/mclust

我是 R 的初学者，所以如果这是一个愚蠢的问题，请多多包涵。

我正在尝试使用 mclust 包的 TidyLPA 包装器在 R 中运行潜在配置文件分析 (LPA)。我的数据框加载到 R 中没有问题/错误消息，我已经仔细检查以确保数据正确加载。每当我运行 LPA 时，我都会收到以下警告消息"In data.row.names(row.names, rowsi, i) : some row.names duplicated: 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28 --> row.names NOT used"

我已经尝试了在其他线程上提出的一些建议，例如检查anyDuplicated(row.names(mydataframe))- 它告诉我没有重复的行名 - 或者make.names(mydataframe, unique=TRUE- 这不能解决问题。我不确定问题出在我的数据（我已经检查过重复的行名）还是我的代码中。抱歉，如果有一个明显的答案，我真的需要一些帮助才能让这段代码正常运行。

完整代码复制如下。

非常感谢您提供的任何帮助！

r dataframe rowname mclust

2020-06-04T19:12:11.870

0 投票

1 回答

114 浏览

r - 从模型输出中收集信息的简单方法

考虑这个数据框：

我正在使用 mclust 包来拟合混合模型并获得自举标准错误，如下所示：

接下来我想创建一个新的数据框来显示每个观察的混合概率，所以我将原始数据dat1与mod$z.

现在我要收集：1）每个集群中每个变量的平均值，以及 2）每个平均值的标准误差（来自summary(boot, what = "SE")$mean）。我将使用这些来创建下面的图，并返回一个显示平均值和 SE 值的表。

最终，我想编写一个函数来执行每个步骤并立即返回输出。它将应用于结构类似于的数据帧dat1，但它们的var列数不同。我还需要指定要使用的集群数量以及创建时要使用的模型mod。有什么更好的方法来收集存储在其中的信息，a以便可以将相同的过程应用于函数内的变量（var.列）和混合成分（G在中指定mod）的任何组合？

r function dplyr functional-programming mclust

2020-06-15T13:26:56.353

0 投票

1 回答

24 浏览

r - 在 Ubuntu v20.04 上的 R v4.0.1 上安装 mclust 包 v5.4.6 挂起

在 Ubuntu 20.04 上使用 R 4.0.1 执行 'Rscript -e "install.packages('mclust')"` 后，该过程在包准备期间挂起。知道如何解决或调试此问题吗？

环境： R v4.0.1、GCC v9、Ubuntu v20.04

CMD: Rscript -e "install.packages('mclust')"

r installation package freeze mclust

2020-06-17T17:34:40.803

0 投票

1 回答

57 浏览

r - 集群不包含观测值

我使用 Mclust / GMM 在生产中实施了集群解决方案。该算法在初始数据上运行，解决方案将应用于看不见的数据（predict.Mclust）。它工作得很好，现在当我使用相同的种子对相同的数据运行函数时，它给了我一个不同的解决方案。有没有观察到的集群。这怎么可能发生？我真的很感谢你的帮助。先感谢您。如果您需要更多详细信息，请告诉我

r cluster-analysis mclust

2020-07-15T15:29:08.463

问题标签 [mclust]

Reference