“expectation-maximization”的相关标签问题

0 投票

5 回答

3178 浏览

algorithm - 立方体上的等距点

我需要初始化一些三维点，我希望它们在整个立方体中等距分布。有没有创造性的方法来做到这一点？

我正在使用迭代期望最大化算法，我希望我的初始向量均匀地“跨越”空间。

例如，假设我想在一个大小为 1x1x1 的立方体中平均分配 8 个点。我想要边长为 0.333 的立方体角上的点，在较大的立方体内居中。

下面是一个 2D 示例。请注意，红点与彼此和边缘等距。我希望 3D 也一样。

等距点

在点数没有整数立方根的情况下，我可以在排列中留下一些“间隙”。

目前我正在取点数的立方根，并使用它来计算点数和它们之间的所需距离。然后我遍历这些点并增加 X、Y 和 Z 坐标（交错以使 Y 在 X 循环回 0 之前不会增加，对于 Z 而言与 Y 相同）。

如果在 MATLAB 中有一种简单的方法可以做到这一点，我很乐意使用它。

2009-07-03T19:53:33.127

0 投票

2 回答

5574 浏览

r - 您使用什么方法来选择 k-means 和 EM 中的最佳聚类数？

有许多聚类算法可用。一种流行的算法是 K-means，其中基于给定数量的集群，该算法迭代以找到对象的最佳集群。

您使用什么方法来确定 k-means 聚类中数据中的聚类数？

R 中是否有任何可用的包包含V-fold cross-validation确定正确集群数量的方法？

另一种常用的方法是期望最大化（EM）算法，它为每个实例分配一个概率分布，表明它属于每个集群的概率。

这个算法是在 R 中实现的吗？

如果是，是否可以通过交叉验证自动选择最佳集群数量？

您是否更喜欢其他聚类方法？

r cluster-analysis data-mining expectation-maximization

2010-02-22T17:53:52.563

0 投票

3 回答

343 浏览

r - 如何加速这种双 for 循环？

我正在用 R 编写一个期望最大化算法。为了加快计算速度，我想对这个瓶颈进行矢量化。我知道N大约是k的一百倍。

还有这个矩阵列表：

我使用以下方法加快了速度：

和：

r performance for-loop vectorization expectation-maximization

2010-11-22T18:20:57.580

0 投票

1 回答

839 浏览

lucene - Lucene 项向量多元贝叶斯模型期望最大化

我正在尝试为文档聚类实现期望最大化算法。我打算使用 Lucene 术语向量来查找 2 个文档之间的相似性。使用朴素贝叶斯的 EM 算法有 2 种：多元模型和多项模型。简单来说，多项式模型使用文档中不同单词的频率，而多元模型仅使用文档中是否存在单词的信息（布尔向量）。

我知道 Lucene 中的术语向量存储当前文档中存在的术语及其频率。这正是多项式模型所需要的。

但是多变量模型需要以下内容：一个向量，用于存储特定项的存在或不存在。因此，所有文档中的所有术语都必须由该向量处理。

举个例子：

doc1 : 字段 CONTENT 有以下术语：这是快乐的世界。

doc2 : field CONTENT 有以下术语：这个神奇的世界充满了讽刺的人。

现在我需要的向量应该是

<这是令人惊叹的充满讽刺的人的快乐世界>（它包含了所有文件中的所有文字）

对于 doc1，这个向量的值是 <1 1 1 1 1 1 0 0 0 0>

对于 doc2，这个向量的 vakue 是 <1 1 0 1 0 0 1 1 1 1>

有没有办法在 Lucene 中生成这样的布尔向量？

lucene expectation-maximization

2011-02-21T19:52:17.517

0 投票

1 回答

6965 浏览

matlab - 用于聚类的期望最大化 (EM) 算法

知道 EM 算法适用于拟合高斯混合。在 MATLAB中是否有任何用k-means, 解释的算法示例？

我找到了这个m 文件：

matlab artificial-intelligence expectation-maximization

2011-03-13T22:58:44.500

0 投票

3 回答

1195 浏览

matlab - 期望最大化问题 - 如何在数据中找到最佳高斯数

2 维数据图

在应用期望最大化算法之前，是否有任何算法或技巧来确定应该在一组数据中识别的高斯数？

例如，在上面的二维数据图中，当我应用期望最大化算法时，我尝试将 4 个高斯拟合到数据中，我会得到以下结果。

在此处输入图像描述

但是如果我不知道数据中的高斯数怎么办？有没有我可以应用的算法或技巧来找出这个细节？

matlab data-mining expectation-maximization

2011-06-29T18:50:36.610

0 投票

3 回答

8575 浏览

matlab - Matlab中缺失数据的期望最大化

我必须使用EM来估计这两个类中每一类的高斯分布的均值和协方差。他们也有一些缺失的属性。

每个对象的类是已知的。因此，问题基本上归结为拟合缺少元素的高斯模型。

哪个库最好用？

ECM算法与EM算法有何不同？

matlab machine-learning data-mining gaussian expectation-maximization

2011-09-06T09:37:32.630

0 投票

1 回答

1890 浏览

php - 使用 NaiveBayes 实现期望最大化算法

我已经实现了具有良好文本过滤的 Naive-Bayes 文档分类，并且我已经接受了具有良好准确性的统计结果，我需要使用 EM 算法来增强我的结果。

但我不知道我是否可以将 EM 算法与 Naive-Bayes 结果应用或将算法应用于数据并重新开始，因此我可以比较结果

在这两种情况下，我都需要了解这个问题上的 EM 算法，因为这真的让我很困惑

任何解释清楚的文件将不胜感激

php statistics document-classification expectation-maximization

2012-02-12T13:42:58.360

0 投票

1 回答

791 浏览

cluster-analysis - Weka EM 集群在 Eclipse 中得到“错误：无法找到或加载主类测试”

我想使用 weka 在 JSP 的数据库中对推文进行聚类。在 GUI 中，我发现只有 HierarchiccalClusterer 和 Filteredcluster 可用于字符串聚类。然后我从weka官网找到这个clusteringdemo示例代码：https ://svn.scms.waikato.ac.nz/svn/weka/trunk/wekaexamples/src/main/java/wekaexamples/clusterers/ClusteringDemo.java

但是，在 weka 目录中设置示例 arff 代码后，我收到此错误“错误：无法找到或加载主类 ClusteringDemo”。谁能帮我找出原因？我只更改语句 data = DataSource.read(filename); 中的文件名。此外，我的类路径设置正确，因为我已经做了一些分类器。

cluster-analysis weka main expectation-maximization

2012-05-01T02:06:06.050

0 投票

1 回答

2109 浏览

python - Numpy __array_prepare__ 错误

我正在尝试使用我在网上找到的用于最大化期望的配方（http://code.activestate.com/recipes/577735-expectation-maximization/）。我遇到以下错误：

算法一定有缺陷，或者我输入错误，但我找不到问题所在。我发现错误是由减法引起的，x-m但是我认为应该可以。x.dtype=int64m.dtype=float64

有没有人有任何想法？

python numpy machine-learning scipy expectation-maximization

2012-05-08T16:57:33.380

问题标签 [expectation-maximization]

Reference