问题标签 [expectation-maximization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
3178 浏览

algorithm - 立方体上的等距点

我需要初始化一些三维点,我希望它们在整个立方体中等距分布。有没有创造性的方法来做到这一点?

我正在使用迭代期望最大化算法,我希望我的初始向量均匀地“跨越”空间。

例如,假设我想在一个大小为 1x1x1 的立方体中平均分配 8 个点。我想要边长为 0.333 的立方体角上的点,在较大的立方体内居中。

下面是一个 2D 示例。请注意,红点与彼此和边缘等距。我希望 3D 也一样。

等距点

在点数没有整数立方根的情况下,我可以在排列中留下一些“间隙”。

目前我正在取点数的立方根,并使用它来计算点数和它们之间的所需距离。然后我遍历这些点并增加 X、Y 和 Z 坐标(交错以使 Y 在 X 循环回 0 之前不会增加,对于 Z 而言与 Y 相同)。

如果在 MATLAB 中有一种简单的方法可以做到这一点,我很乐意使用它。

0 投票
2 回答
5574 浏览

r - 您使用什么方法来选择 k-means 和 EM 中的最佳聚类数?

有许多聚类算法可用。一种流行的算法是 K-means,其中基于给定数量的集群,该算法迭代以找到对象的最佳集群。

您使用什么方法来确定 k-means 聚类中数据中的聚类数?

R 中是否有任何可用的包包含V-fold cross-validation确定正确集群数量的方法?

另一种常用的方法是期望最大化(EM)算法,它为每个实例分配一个概率分布,表明它属于每个集群的概率。

这个算法是在 R 中实现的吗?

如果是,是否可以通过交叉验证自动选择最佳集群数量?

您是否更喜欢其他聚类方法?

0 投票
3 回答
343 浏览

r - 如何加速这种双 for 循环?

我正在用 R 编写一个期望最大化算法。为了加快计算速度,我想对这个瓶颈进行矢量化。我知道N大约是k的一百倍。

还有这个矩阵列表:


我使用以下方法加快了速度:

和:

0 投票
1 回答
839 浏览

lucene - Lucene 项向量多元贝叶斯模型期望最大化

我正在尝试为文档聚类实现期望最大化算法。我打算使用 Lucene 术语向量来查找 2 个文档之间的相似性。使用朴素贝叶斯的 EM 算法有 2 种:多元模型和多项模型。简单来说,多项式模型使用文档中不同单词的频率,而多元模型仅使用文档中是否存在单词的信息(布尔向量)。

我知道 Lucene 中的术语向量存储当前文档中存在的术语及其频率。这正是多项式模型所需要的。

但是多变量模型需要以下内容: 一个向量,用于存储特定项的存在或不存在。因此,所有文档中的所有术语都必须由该向量处理。

举个例子:

doc1 : 字段 CONTENT 有以下术语:这是快乐的世界。

doc2 : field CONTENT 有以下术语:这个神奇的世界充满了讽刺的人。

现在我需要的向量应该是

<这是令人惊叹的充满讽刺的人的快乐世界>(它包含了所有文件中的所有文字)

对于 doc1,这个向量的值是 <1 1 1 1 1 1 0 0 0 0>

对于 doc2,这个向量的 vakue 是 <1 1 0 1 0 0 1 1 1 1>

有没有办法在 Lucene 中生成这样的布尔向量?

0 投票
1 回答
6965 浏览

matlab - 用于聚类的期望最大化 (EM) 算法

知道 EM 算法适用于拟合高斯混合。在 MATLAB中是否有任何用k-means, 解释的算法示例?

我找到了这个m 文件

0 投票
3 回答
1195 浏览

matlab - 期望最大化问题 - 如何在数据中找到最佳高斯数

2 维数据图

在应用期望最大化算法之前,是否有任何算法或技巧来确定应该在一组数据中识别的高斯数?

例如,在上面的二维数据图中,当我应用期望最大化算法时,我尝试将 4 个高斯拟合到数据中,我会得到以下结果。

在此处输入图像描述

但是如果我不知道数据中的高斯数怎么办?有没有我可以应用的算法或技巧来找出这个细节?

0 投票
3 回答
8575 浏览

matlab - Matlab中缺失数据的期望最大化

我必须使用EM来估计这两个类中每一类的高斯分布的均值和协方差。他们也有一些缺失的属性。

每个对象的类是已知的。因此,问题基本上归结为拟合缺少元素的高斯模型。

哪个库最好用?

ECM算法与EM算法有何不同?

0 投票
1 回答
1890 浏览

php - 使用 NaiveBayes 实现期望最大化算法

我已经实现了具有良好文本过滤的 Naive-Bayes 文档分类,并且我已经接受了具有良好准确性的统计结果,我需要使用 EM 算法来增强我的结果。

但我不知道我是否可以将 EM 算法与 Naive-Bayes 结果应用或将算法应用于数据并重新开始,因此我可以比较结果

在这两种情况下,我都需要了解这个问题上的 EM 算法,因为这真的让我很困惑

任何解释清楚的文件将不胜感激

0 投票
1 回答
791 浏览

cluster-analysis - Weka EM 集群在 Eclipse 中得到“错误:无法找到或加载主类测试”

我想使用 weka 在 JSP 的数据库中对推文进行聚类。在 GUI 中,我发现只有 HierarchiccalClusterer 和 Filteredcluster 可用于字符串聚类。然后我从weka官网找到这个clusteringdemo示例代码:https ://svn.scms.waikato.ac.nz/svn/weka/trunk/wekaexamples/src/main/java/wekaexamples/clusterers/ClusteringDemo.java

但是,在 weka 目录中设置示例 arff 代码后,我收到此错误“错误:无法找到或加载主类 ClusteringDemo”。谁能帮我找出原因?我只更改语句 data = DataSource.read(filename); 中的文件名。此外,我的类路径设置正确,因为我已经做了一些分类器。

0 投票
1 回答
2109 浏览

python - Numpy __array_prepare__ 错误

我正在尝试使用我在网上找到的用于最大化期望的配方(http://code.activestate.com/recipes/577735-expectation-maximization/)。我遇到以下错误:

算法一定有缺陷,或者我输入错误,但我找不到问题所在。我发现错误是由减法引起的,x-m但是我认为应该可以。x.dtype=int64m.dtype=float64

有没有人有任何想法?