问题标签 [mixture-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中使用 mclust 包的 coordProj 绘图,如何更改“错误”图中的符号和颜色
我正在使用包 mclust 的 coordProj 功能,当您使用“错误”选项进行绘图时,我想更改符号和颜色。
我的代码
这里的情节(http://i.stack.imgur.com/Nmgbq.png)
我正在尝试用字符“F”来改变黑点,而用“T”来改变其他的黑点。我不知道这是不可能的,还是我做错了。
matlab - 简化 EM 的公式
我想在 Matlab 中计算下面的公式(E-step of EM for Multinomial Mixture Model),
g 和 θ 是矩阵,θ 和 λ 具有以下约束:
但是 m 的计数超过 1593,并且当计算 θ 的乘积时,数字变得非常小,Matlab 将其保存为零。任何人都可以简化 g 公式或使用其他技巧来解决这个问题?
更新:
数据: data.txt (下载后,将文件扩展名更改为“mat”)
代码:
结尾
matlab - MATLAB中使用gpu的快速高斯混合模型
我想在 MATLAB 中拟合高斯混合模型。具体来说,我想从不同的起点拟合数百个模型,并将它们拟合为几次 EM 迭代(例如 10 次)。最终目的是利用遗传算法寻找一个好的模型。
拟合混合模型非常耗时,所以我想知道是否有任何使用 MATLAB 的并行处理工具箱在 gpu 上运行的快速实现?我尝试通过将 gpuArray 传递给 gmcluster 函数并将 gmcluster 和相关文件中的适当变量更改为 gpuArray 来实现一个简单的 gpu 版本。这实际上使运行时变得更糟(在特定数据集 CPU 时间为 0.1 而 GPU 为 0.2)。
是否可以对天真的 gpu 实现进行任何改进?(我是 gpu 编程的新手)。
我知道有一些实现,例如这里的一个,但它不够灵活,无法接受均值和协方差起始参数。
我将不胜感激任何帮助/指针。
谢谢
编辑:这是需要相当长的时间的代码部分,我想在 GPU 上运行。代码计算 mu 中的平均值和 Sigma 中的协方差,给定每个 og k 高斯的概率隶属矩阵 post。
在哪里:
对于我的目的,n 在 1000 到 10,000 之间,d 在 10 左右,k 在 2 到 15 之间。
r - Matlab中的负二项式色散参数
matlab 函数nbinfit
返回负二项式的值r
和p
。matlab 中是否有等效的 MLE 函数,它返回负二项式的“生态”或“Polya”参数化的 mu(均值)和 theta(色散参数)的值?
(类似于fitdistr
R 中的东西)
matlab - 筛选器和 Fisher 向量上的 PCA
我正在阅读这篇特别的论文http://www.robots.ox.ac.uk/~vgg/publications/2011/Chatfield11/chatfield11.pdf,我发现带有 GMM 词汇方法的 Fisher Vector 非常有趣,我想测试一下我自己。
然而,(对我来说)他们如何对数据应用 PCA 降维是完全不清楚的。我的意思是,他们是否计算了特征空间,一旦计算出来,他们会对其执行 PCA 吗?还是他们只是在计算 SIFT 之后对每个图像执行 PCA,然后创建特征空间?
这应该对两个训练测试集都进行吗?对我来说,这是一个“显然是”的答案,但还不清楚。
我正在考虑从训练集创建特征空间,然后在其上运行 PCA。然后,我可以使用训练集中的 PCA 系数来减少每个图像的筛选描述符,该描述符将被编码为 Fisher Vector 以供以后分类,无论是测试图像还是训练图像。
编辑1;
简单的例子:
然后(对于测试和训练图像)
reduced_test_img = test_img * coef;
(然后选择reduce_test_img的前80个维度)
你怎么看?干杯
python - 使用 scikit 学习混合的高斯混合
我想使用 sklearn.mixture.GMM 将高斯混合拟合一些数据,结果类似于我使用 R 的“Mclust”包得到的结果。
数据如下所示:
所以这就是我使用 R 对数据进行聚类的方法,它给了我 14 个很好分离的聚类,而且很容易从楼梯上掉下来:
这就是我在使用 python 尝试时所说的话:
它将所有点分配给同一个集群。我还注意到,当我告诉它找到 1 个集群时,拟合的 AIC 最低,并且随着集群数量的增加线性增加。我究竟做错了什么?我需要考虑其他参数吗?
Mclust 和 sklearn.mixture 使用的模型有区别吗?
但更重要的是:sklearn 中对我的数据进行聚类的最佳方式是什么?
r - R - 为加权观察拟合高斯混合
我一直在尝试为单变量分布拟合高斯混合模型(GMM),其中每个观察值都有一个分配的权重(从 0 到 1)。
为基本的“密度”功能(来自“统计”)分配权重可以很容易地完成,但我无法为 GMM 包作为“mixtools”或“mclust”执行此操作。
后者甚至有一个功能 - 'me.weighted' - 在链接“ http://cran.open-source-solution.org/web/packages/mclust/vignettes/mclust-weights.pdf ”中举例说明,但是我无法让它工作。在他们的示例和我的数据中,我都收到一个错误:
python - scikit-learn 中的混合模型预测分布
我将 scikit 中的混合建模问题提炼到以下 1D 示例。简单地将混合模型拟合到一维密度。我在使用简单 GMM 时体验到了良好的性能,但在使用变分或狄利克雷过程 GMM 时出现了奇怪的行为。首先,拟合非常差,其次,推断的分布没有标准化(参见下面的代码和图像)。
在示例http://scikit-learn.org/stable/auto_examples/mixture/plot_gmm_pdf.html中,同样的行为很明显。GMM 类返回的概率近似归一化,而 DPGMM 类返回的概率没有。通过附加以下行来计算归一化:
这是一个错误,还是我做错了什么?
代码:
distribution - 在 Winbugs 中拟合分布混合(高斯 + 均匀)
我正在尝试将混合分布模型拟合到值向量,混合需要由 2 个高斯分布和 1 个均匀分布组成。我正在尝试在 Winbugs 中实现这一点。我发现了很多使用高斯混合的例子,但不知道如何添加制服。下面的代码贴目前已参数化以适合在零和一之间缩放的值向量,但我得到“节点 NSD [1] 的多个定义”,所以看来我的结构仍然是错误的。有什么建议么?
r - 用于 pscl 跨栏模型的 Flexmix 驱动程序
我一直在尝试使用's implementationR
对障碍模型的有限混合进行编码。我特别感兴趣的是计数数据的负二项式障碍。pscl
hurdle
我遇到了这个包,不幸的是它没有为'sflexmix
提供内置驱动程序。尽管进行了多次尝试,我仍然无法正确编码驱动程序。pscl
hurdle
有没有人用过pscl
's hurdle
with flexmix
,你能分享一下驱动程序的工作实现吗?
提前致谢。