问题标签 [dirichlet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
251 浏览

r - 如何将公式对象传递给 DirichReg(设置函数)

我正在尝试使用 R 中的 DirichReg 包将公式对象传递给 Dirichlet 回归。如下所示,该包似乎无法接受这种格式的公式,但文档中没有任何内容说明此限制。这个工作流程的原因是我正在尝试设置一个交叉验证函数,该函数可以应用于不同公式的列表(具有不同协变量的 IE)并返回样本外预测能力以帮助模型选择。

我的“公式”对象与工作 DirichReg 调用中指定的公式之间似乎没有任何区别。

我的猜测是,它与使用 DR_data 命令格式化响应变量的方式有关,但我想不出一种方法来解决这个问题,以便在函数中动态指定公式。

0 投票
0 回答
384 浏览

bayesian - RJags“无法找到合适的采样器”

我正在尝试使用 Line-Transect Distance Sampling 和数据增强来模拟乌龟洞穴的大小。但是,我不断收到错误消息“无法找到合适的采样器”。

一些背景:洞穴的宽度可以从 4 厘米到 55 厘米不等,并且以各种概率和与景观中的观察者不同的距离被看到。为了实现收敛,我决定使用基于分类的模型。乌龟洞穴被放入 7 个箱中的一个,在给定箱中的概率来自 Dirichlet 分布。

在这部分代码中,增强的洞穴从模型中提取它们的大小:

一旦它们有了大小,就确定了看到洞穴 p[i] 的概率:

所有这些似乎都可以正常工作,但是在评估 y 时问题发生在这里:

我可以运行除 y 之外的每一行,并且模型运行良好。但是添加该行并包含我的 y 数据会引发“无法找到合适的采样器”错误。知道为什么吗?我需要包含这个变量,因为 y 表示我是否真的在调查期间找到了洞穴。

任何建议将不胜感激。

这是带有一些虚假数据的完整代码:

数据:

运行命令:

0 投票
2 回答
29 浏览

process - 狄利克雷过程组选择

我理解 Dirichlet 过程组选择,如下所述:如何在 Dirichlet 过程聚类中决定组分配

但我不明白为什么 DP 组选择算法不使用新项目的功能来确定最佳组成员资格。如果 DP 不使用成员的特征来指导群组成员资格,它将如何找到不同的群组?

0 投票
0 回答
744 浏览

r - 3D 狄利克雷三元图

我正在尝试创建类似于其中之一的 3D(4D?)狄利克雷概率密度函数图(来自Wikipedia):

在此处输入图像描述

我的数据由 3 列和 100000 行组成,其中每行总和为从rdirichlet函数获得的 1。我可以使用创建热图版本DirichletReg,它大致相当于上面维基百科图中右下角的图,如下所示:

在此处输入图像描述

或者我可以创建一个类似于左上角 Wiki 图的统一热图版本,如下所示:

在此处输入图像描述

我的问题:是否可以像维基图一样制作三元图 3D,而不是热图?我曾尝试使用plotlyplot3d包来做到这一点,但无法接近。任何帮助将非常感激。

0 投票
1 回答
155 浏览

r - 嵌套狄利克雷过程的演示代码

我的问题是关于如何使用 R 代码实现嵌套的狄利克雷过程(NDP)。

NDP 适用于对分布进行聚类并同时在分布内进行聚类。罗德里格斯等人。(2008) 提供了一个模拟示例来证明 NDP 区分不同分布的能力。我试图通过重现此示例的结果来学习这种方法。但未能这样做,因为我无法很好地理解基本分布与混合物成分的关系。

模拟示例使用正态反伽马分布 NIG(0,0.01,3,1) 作为基本分布。但是四种不同的分布是:

用于模拟的四种分布

第 4 节 (Rodriguez et al.,2008, p.1135) 中提供的算法用于进行模拟。我很难理解和执行这个算法,尤其是第 5 步:

NDP 采样算法的第 5 步

你能提供一个示例代码来演示这个算法吗?非常感谢您的帮助!

0 投票
0 回答
814 浏览

r - 具有分类 X 的 JAGS 中的 Dirichlet 多项式模型

有人可以为具有一个分类 X 变量(Dirichlet 先验)的贝叶斯多项逻辑模型提供 JAGS 代码吗?我的代表性示例是下面代码中的矩阵“z”,它代表 3 个结果,而代码底部的“站点”是分类 x 变量。

我可以获得估计这 3 个结果中的每一个结果的代码,但我对如何添加分类 X(医院站点)感到困惑。

我想使用第一个结果 z[, 1] 作为参考,使用“a”作为“站点”的参考。

这是估计结果的示例代码(没有分类 X)。这就是我到目前为止所拥有的。任何有关使用 X 扩展此模型的帮助将不胜感激。

0 投票
1 回答
1652 浏览

python - pymc3:具有多维集中因子的狄利克雷

我正在努力实现一个模型,其中 Dirichlet 变量的集中因子取决于另一个变量。

情况如下:

系统因组件故障而失败(共有三个组件,每次测试/观察中只有一个组件失败)。

组件的故障概率取决于温度。

这是该情况的(已评论)简短实现:

_

我在示例函数中收到以下错误:


有什么建议么 ?

0 投票
0 回答
85 浏览

lda - 分层狄利克雷过程 - 推断截断级别

我正在利用 Gensim 的 HDP 实现来推断数据集的主题,但我对截断级别有疑问。

有没有办法推断出最合适的截断级别?我注意到主题的最终数量取决于所选截断级别的值。

0 投票
0 回答
428 浏览

gensim - 关于 alpha 的 LDA Gensim/Mallet 文档

我对 LDA (Gensim) 文档中对 alpha 的评论有点困惑。

在“常规”Gensim LdaModel 中,它说如果设置 alpha = 'asymmetric',Gensim 使用“1.0 / topicno 的固定归一化非对称先验”(topicno 是 num_topics,对吗?!)。但是为什么叫不对称呢?这不是对称情况吗?(见https://radimrehurek.com/gensim/models/ldamodel.html

Mallet 使用的 alpha 的默认数字是多少?50?如果是这样,为什么?据我所知,应该选择一些 <1 的值以获得良好的结果。(见https://radimrehurek.com/gensim/models/wrappers/ldamallet.html

0 投票
2 回答
627 浏览

python - 使用在线 LDA 预测测试数据

我正在使用在线 LDA 来执行一些主题建模任务。我正在使用基于论文 Original Online LDA 论文的核心代码:Hoffman、Blei 和 Bach,“Online Learning for Latent Dirichlet Allocation”。NIPS,2010。代码可在以下网址获得:https ://github.com/blei-lab/onlineldavb 。

我正在使用一组约 167000 个文档。该代码生成 lambda 文件作为我用来生成主题的输出(https://github.com/wellecks/online_lda_python,printtopics.py)。但我不确定如何使用它来查找新测试数据的主题(类似于 gensim 中的 model.get_document_topics )。请帮助解决我的困惑。