问题标签 [expectation-maximization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 立方体上的等距点
我需要初始化一些三维点,我希望它们在整个立方体中等距分布。有没有创造性的方法来做到这一点?
我正在使用迭代期望最大化算法,我希望我的初始向量均匀地“跨越”空间。
例如,假设我想在一个大小为 1x1x1 的立方体中平均分配 8 个点。我想要边长为 0.333 的立方体角上的点,在较大的立方体内居中。
下面是一个 2D 示例。请注意,红点与彼此和边缘等距。我希望 3D 也一样。
在点数没有整数立方根的情况下,我可以在排列中留下一些“间隙”。
目前我正在取点数的立方根,并使用它来计算点数和它们之间的所需距离。然后我遍历这些点并增加 X、Y 和 Z 坐标(交错以使 Y 在 X 循环回 0 之前不会增加,对于 Z 而言与 Y 相同)。
如果在 MATLAB 中有一种简单的方法可以做到这一点,我很乐意使用它。
r - 您使用什么方法来选择 k-means 和 EM 中的最佳聚类数?
有许多聚类算法可用。一种流行的算法是 K-means,其中基于给定数量的集群,该算法迭代以找到对象的最佳集群。
您使用什么方法来确定 k-means 聚类中数据中的聚类数?
R 中是否有任何可用的包包含V-fold cross-validation
确定正确集群数量的方法?
另一种常用的方法是期望最大化(EM)算法,它为每个实例分配一个概率分布,表明它属于每个集群的概率。
这个算法是在 R 中实现的吗?
如果是,是否可以通过交叉验证自动选择最佳集群数量?
您是否更喜欢其他聚类方法?
lucene - Lucene 项向量多元贝叶斯模型期望最大化
我正在尝试为文档聚类实现期望最大化算法。我打算使用 Lucene 术语向量来查找 2 个文档之间的相似性。使用朴素贝叶斯的 EM 算法有 2 种:多元模型和多项模型。简单来说,多项式模型使用文档中不同单词的频率,而多元模型仅使用文档中是否存在单词的信息(布尔向量)。
我知道 Lucene 中的术语向量存储当前文档中存在的术语及其频率。这正是多项式模型所需要的。
但是多变量模型需要以下内容: 一个向量,用于存储特定项的存在或不存在。因此,所有文档中的所有术语都必须由该向量处理。
举个例子:
doc1 : 字段 CONTENT 有以下术语:这是快乐的世界。
doc2 : field CONTENT 有以下术语:这个神奇的世界充满了讽刺的人。
现在我需要的向量应该是
<这是令人惊叹的充满讽刺的人的快乐世界>(它包含了所有文件中的所有文字)
对于 doc1,这个向量的值是 <1 1 1 1 1 1 0 0 0 0>
对于 doc2,这个向量的 vakue 是 <1 1 0 1 0 0 1 1 1 1>
有没有办法在 Lucene 中生成这样的布尔向量?
matlab - 用于聚类的期望最大化 (EM) 算法
知道 EM 算法适用于拟合高斯混合。在 MATLAB中是否有任何用k-means
, 解释的算法示例?
我找到了这个m 文件:
matlab - 期望最大化问题 - 如何在数据中找到最佳高斯数
在应用期望最大化算法之前,是否有任何算法或技巧来确定应该在一组数据中识别的高斯数?
例如,在上面的二维数据图中,当我应用期望最大化算法时,我尝试将 4 个高斯拟合到数据中,我会得到以下结果。
但是如果我不知道数据中的高斯数怎么办?有没有我可以应用的算法或技巧来找出这个细节?
matlab - Matlab中缺失数据的期望最大化
我必须使用EM来估计这两个类中每一类的高斯分布的均值和协方差。他们也有一些缺失的属性。
每个对象的类是已知的。因此,问题基本上归结为拟合缺少元素的高斯模型。
哪个库最好用?
ECM算法与EM算法有何不同?
php - 使用 NaiveBayes 实现期望最大化算法
我已经实现了具有良好文本过滤的 Naive-Bayes 文档分类,并且我已经接受了具有良好准确性的统计结果,我需要使用 EM 算法来增强我的结果。
但我不知道我是否可以将 EM 算法与 Naive-Bayes 结果应用或将算法应用于数据并重新开始,因此我可以比较结果
在这两种情况下,我都需要了解这个问题上的 EM 算法,因为这真的让我很困惑
任何解释清楚的文件将不胜感激
cluster-analysis - Weka EM 集群在 Eclipse 中得到“错误:无法找到或加载主类测试”
我想使用 weka 在 JSP 的数据库中对推文进行聚类。在 GUI 中,我发现只有 HierarchiccalClusterer 和 Filteredcluster 可用于字符串聚类。然后我从weka官网找到这个clusteringdemo示例代码:https ://svn.scms.waikato.ac.nz/svn/weka/trunk/wekaexamples/src/main/java/wekaexamples/clusterers/ClusteringDemo.java
但是,在 weka 目录中设置示例 arff 代码后,我收到此错误“错误:无法找到或加载主类 ClusteringDemo”。谁能帮我找出原因?我只更改语句 data = DataSource.read(filename); 中的文件名。此外,我的类路径设置正确,因为我已经做了一些分类器。
python - Numpy __array_prepare__ 错误
我正在尝试使用我在网上找到的用于最大化期望的配方(http://code.activestate.com/recipes/577735-expectation-maximization/)。我遇到以下错误:
算法一定有缺陷,或者我输入错误,但我找不到问题所在。我发现错误是由减法引起的,x-m
但是我认为应该可以。x.dtype=int64
m.dtype=float64
有没有人有任何想法?