问题标签 [expectation-maximization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
714 浏览

cluster-analysis - EM 软聚类与 K-Means 的基准测试?

我有两种实现,一种是 K-Means,另一种是 EM 进行软聚类。但我不知道如何在准确性方面验证它们。即哪一个通过检索更好的集群表现更好。我的假设是,因为 EM 是在做软分配,而不是像在 K-Means 中那样做硬分配。EM表现更好,但我不知道如何做这个比较......

如何对 EM 软聚类与 K-Means 的准确性进行基准测试?以及对合成数据的任何建议?

0 投票
2 回答
3834 浏览

r - 关于如何使用 ggplot2 绘制 mixEM 类型数据的任何建议

我有一个从我的原始数据中获得的 100 万条记录的样本。(供您参考,您可以使用可能产生近似相似分布的虚拟数据

) 我认为直方图是两个对数正态分布的混合,我尝试使用以下代码使用 EM 算法拟合求和分布:

第一个图是对数似然图,第二个图(如果再次点击返回)给出类似于以下密度曲线:

混合模型密度曲线

正如我提到的,c1 是 mixEM[] 类型,而 plot() 函数可以适应这种情况。我想用颜色填充密度曲线。使用 ggplot2() 很容易做到这一点,但 ggplot2() 不支持 mixEM[] 类型的数据并抛出此消息:

ggplot 不知道如何处理 mixEM 类的数据

有没有其他方法可以解决这个问题?

0 投票
1 回答
498 浏览

c++ - 提高期望最大化的性能

我在 C++ 中实现期望最大化(EM)来估计高斯混合模型的参数。

EM 收敛速度非常慢 - 是否有一种技术可以快速收敛对数似然?

0 投票
0 回答
227 浏览

probability - 什么是隐藏(未观察到的)数据?GMM 中的隐藏数据是什么?

我正在一起学习EM算法和GMM

我不理解维基百科中描述的 EM 算法:

EM算法用于在方程不能直接求解的情况下找到统计模型的最大似然参数。通常,这些模型除了未知参数和已知数据观察之外还涉及潜在变量。

直到现在,我对这种情况下的潜在变量感到好奇。

也就是说,要么数据中存在缺失值,要么可以通过假设存在其他未观察到的数据点来更简单地制定模型。

这句话,你能举一个关于丢失或未观察到的数据的简单例子吗?

不幸的是,维基百科中有一个例子,但我很难理解这个概念,我对高斯混合模型中的隐藏数据感到好奇。

我认为均值、协方差和加权因子是未知参数。

那么高斯混合模型中的隐藏数据是什么?

还是我的想法错了?

0 投票
2 回答
2703 浏览

python - 如何使用 Python 保存/编写 OpenCV EM/GMM 模型?

我想知道是否存在任何方法/函数可用于保存使用 Python 在 OpenCV 中定义的训练有素的 EM(期望最大化或高斯混合模型)模型?

我已经尝试过Pickle dump()方法,但它不起作用。它显示一个错误:TypeError: can't pickle EM objects。此外,我还尝试了其他简单的方法,例如文件打开和写入(以 XML 格式)。但是,它也不起作用。

这是我的 Python 代码的一部分:

我想将此gmm_clf保存到一个文件中,以便以后可以将其用于测试目的。

0 投票
0 回答
784 浏览

c++ - 对高斯混合模型使用 C++ 犰狳期望最大化

我正在尝试使用犰狳的期望最大化最大化 gmm_diag 类,但是当我尝试编译它时,我得到“错误 gmm_diag 未在此范围内声明”。

我的代码如下:

0 投票
0 回答
89 浏览

c++ - 一行夸大的执行时间

我正在用 C++ 开发一个带有 OpenCV 的程序。该程序运行良好。我放在下面的代码行通常需要几毫秒才能执行,但有时同一行需要 5、10 甚至 50 秒。

你知道可能是什么问题吗?输入通常是相同的大小。

0 投票
0 回答
213 浏览

r - 使用 R 的具有参数限制的 EM 算法

使用任何类型的数据,在我的例子中,来自三个混合伽马分布的数据,目标是参数化分布的 theta 和分布权重 alpha,它们都是 0< 并且总和为 1。

如何将 alpha 的总和限制为一个,其中没有 alpha 为负数?

0 投票
1 回答
659 浏览

java - 在 Weka 中以编程方式获取 EM 聚类器输出

在 Weka 中使用 Kmeans 时,可以调用getAssignments()模型的结果输出来获取每个给定实例的集群分配。我在 weka 上使用 EM 聚类。我想得到像 weka's explorer 这样的输出,或者 EM 有类似的东西吗?我应该怎么办?

我试过这个:Getting Xmeans clusterer output in programmatically in Weka

在此处输入图像描述

0 投票
1 回答
1057 浏览

machine-learning - 在 scikit learn 中对标记和未标记数据使用高斯混合模型?

我有一些数据,其中一些被标记,一些没有被标记。我需要应用期望最大化算法。是否可以在 Sci-kit learn 中应用它?任何标记+未标记实例的示例都会有所帮助。