问题标签 [mclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 从 mclust 包计算 AWE
是否可以根据通过 mclust R 包获得的信息计算近似证据权重 (AWE)?
r - 将具有 row.names 的值的数字列表对象添加到没有 row.names 的相同长度的数据框中
我已经使用 mclust 包在一个非缺失数据帧上执行了一个操作。非缺失数据框是使用 dplyr 包通过 select 函数创建的。因此,row.names 在传递给 mclust 函数的数据框中显示为一个向量。
接下来我从这个函数中提取了一些关键值(案例“分类”):
因此,分类值的数字列表与 row.names 相关联。
当我尝试将此值列表附加到没有 row.names 的相同长度(相同情况)的新数据帧时,我似乎失去了重要的排序。我知道这一点,因为当我比较新数据框中其他变量的分类组时,它们不等于使用这些相同变量在 mclust 函数中获得的值。
我不能简单地附加到 mclust 函数中使用的非缺失数据框(带有 row.names)的原因是,我需要函数中未使用的数据集中的其他变量,并且需要在 ID 变量上合并为:
所以我最终得到了一个长度相同但不再有 row.names 的数据框,我想在上面添加来自上述 mclust 函数的分类值。虽然我使用时没有抛出错误:
数据已关闭,因为我可以看到对相关变量的组(类)手段的检查不等于 mclust 函数中的那些(它们应该是相同的核心输入数据)。
我意识到我在这里遗漏了一些明显的东西,但是尽管对档案进行了详尽的搜索,但我还没有找到答案。进行这种相当乏味的争论的正确方法是什么?
r - 对 .mat 文件中的数据使用 mclust
我是 R 新手,我正在尝试使用 mclust 包。
我需要做的是从data.mat
文件中获取数据并使用 mclust 对其进行聚类。
我使用的代码是:
我收到以下错误:
拟合...
|
| mvnX 中的 0% 错误(数据 = 数据,之前 = 之前):(
列表)对象不能被强制输入“双精度”
我已经测试过summary(data['X'])
,数据是数字的
长度类模式
X 29000000 -none- numeric
我试过使用as.matrix(data['X'])
,我得到了同样的错误。
我尝试了不同的方法modelName
,但我得到了同样的错误。
当然我错过了一些东西,帮助我:(
r - grid.Call.graphics 中的错误(C_polygon,x$x,x$y,index):“cluster”(包 Mclust)中的颜色名称无效
我将 mclust 包中的基于模型的聚类用于我的数据集的一个子集。MClust 推荐 1 个集群。图形显示中显示以下错误:
错误消息:grid.Call.graphics 中的错误(C_polygon,x$x,x$y,索引):'cluster' 中的颜色名称无效
这是我的数据集的一部分:
r - 安装 mclust 包问题。安装正在准备延迟加载并且永远不会完成
在 Ubuntu 20.04 上加载 R 4.0.0 后。
并加载了以下软件包:
我尝试安装包mclust
,而 R 在准备延迟加载时卡住了。
我等了一夜,但安装仍然卡在同一点。有谁知道如何解决这个问题?
我已经安装了不同的软件包,没有任何问题。这是已安装在我的库目录中的软件包的完整列表:
r - 如何修复“row.names 重复”错误 R 包 TidyLPA/mclust
我是 R 的初学者,所以如果这是一个愚蠢的问题,请多多包涵。
我正在尝试使用 mclust 包的 TidyLPA 包装器在 R 中运行潜在配置文件分析 (LPA)。我的数据框加载到 R 中没有问题/错误消息,我已经仔细检查以确保数据正确加载。每当我运行 LPA 时,我都会收到以下警告消息"In data.row.names(row.names, rowsi, i) :
some row.names duplicated: 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28 --> row.names NOT used"
我已经尝试了在其他线程上提出的一些建议,例如检查anyDuplicated(row.names(mydataframe))
- 它告诉我没有重复的行名 - 或者make.names(mydataframe, unique=TRUE
- 这不能解决问题。我不确定问题出在我的数据(我已经检查过重复的行名)还是我的代码中。抱歉,如果有一个明显的答案,我真的需要一些帮助才能让这段代码正常运行。
完整代码复制如下。
非常感谢您提供的任何帮助!
r - 从模型输出中收集信息的简单方法
考虑这个数据框:
我正在使用 mclust 包来拟合混合模型并获得自举标准错误,如下所示:
接下来我想创建一个新的数据框来显示每个观察的混合概率,所以我将原始数据dat1
与mod$z
.
现在我要收集:1)每个集群中每个变量的平均值,以及 2)每个平均值的标准误差(来自summary(boot, what = "SE")$mean
)。我将使用这些来创建下面的图,并返回一个显示平均值和 SE 值的表。
最终,我想编写一个函数来执行每个步骤并立即返回输出。它将应用于结构类似于 的数据帧dat1
,但它们的var
列数不同。我还需要指定要使用的集群数量以及创建时要使用的模型mod
。有什么更好的方法来收集存储在其中的信息,a
以便可以将相同的过程应用于函数内的变量(var.
列)和混合成分(G
在 中指定mod
)的任何组合?
r - 在 Ubuntu v20.04 上的 R v4.0.1 上安装 mclust 包 v5.4.6 挂起
在 Ubuntu 20.04 上使用 R 4.0.1 执行 'Rscript -e "install.packages('mclust')"` 后,该过程在包准备期间挂起。知道如何解决或调试此问题吗?
环境: R v4.0.1、GCC v9、Ubuntu v20.04
CMD: Rscript -e "install.packages('mclust')"