问题标签 [dirichlet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
588 浏览

machine-learning - 我们怎么知道狄利克雷分布描述的是主题而不是其他东西?

Dirichlet 分布用于文档建模。

我从这篇文章中读到:

不同的 Dirichlet 分布可用于对不同作者的文档或不同主题的文档进行建模。

那么我们如何判断它是针对不同作者还是针对不同主题进行建模呢?这很重要,因为在文档聚类任务中,它直接决定了聚类结果的语义。

而且我发现将建模的可能方面仅限于作者或主题过于主观。由于似乎没有强有力的证据支持某个特定方面,因此它可能是任何其他潜在/潜在方面。

任何人都可以对此有所了解吗?

0 投票
2 回答
4302 浏览

python - 如何使用 pymc 为贝叶斯网络制作条件概率表 (CPT)

我想建立一个依赖于其他分类变量的离散(pymc.Categorical)变量的贝叶斯网络。作为一个最简单的例子,假设变量ab是分类变量,并且b取决于a

这是使用 pymc 对其进行编码的尝试(假设a采用三个值之一,b采用四个值之一)。想法是使用 pymc 从数据中学习 CPT 分布。

如果我们绘制这个模型,它看起来像这样

然而,运行这段代码我们得到一个错误:

显然,pymc 可以将 Dirichlet 变量作为分类变量的参数。当 Categorical 变量将 Dirichlet 变量作为其参数时,它知道期望 k-1 个概率向量,并假设第 k 个概率将向量求和为 1。但是,当 Dirichlet 变量是一个确定性变量,这是我制作 CPT 所需要的。

我会以正确的方式解决这个问题吗?如何解决表示不匹配的问题?我应该提一下,我对 pymc 和 Python 比较陌生。

这个问题与上一个关于使用 pymc 制作离散状态马尔可夫模型的问题有关

0 投票
3 回答
1538 浏览

r - LDA 主题模型包

同学们,

我是主题建模的初学者。我在 R 中使用主题模型包。函数调用是 LDA(data, k)。

我想知道使用了哪些 alpha 和 beta 值?另外,哪种推理算法用于参数估计?变分 EM 还是 Gibbs?

谢谢

0 投票
1 回答
581 浏览

python - 在 PyMC 中打印跟踪时出现 KeyError

我读过默认情况下某些名称被分配给随机变量。我正在下面写我的代码的相关部分。

最后一行引发错误KeyError: 'parameters_0'有人可以解释为什么会这样。

但如果我使用Matplot.plot(m),我会得到图(我附在下面)。我的印象是键是parameters_0,parameters_1,parameters_2。

有什么方法可以让我知道所有存在痕迹的键吗?

在此处输入图像描述)

0 投票
1 回答
945 浏览

python - PyMC 中的狄利克雷分布

有人可以解释一下在 PyMC 中使用 Dirichlet 发行版(带有工作示例)吗?

我意识到这是微不足道的,但我无法找到所有组件的踪迹。有什么出路吗?

我已经在这里发布了我的代码的相关部分

在 PyMC 中打印跟踪时出现 KeyError

0 投票
1 回答
76 浏览

python - pymc 中 dirichlet 随机变量的 logp 大于 1

据我了解,logp 应该 b2 <= 0,否则概率将 > 1(这是不可能的)。

有人可以解释为什么我会得到如此奇怪的结果。我正在下面编写代码的相关部分。

我得到以下输出

这是一件很奇怪的事情。我没有在 pymc 中使用 dirichlet 随机变量的经验。我只是在文档中查找了语法并编写了它。我可能是错的,如果是,请纠正我。

另一个小问题

无论我采用多少随机值,即使我每次都得到不同的值,对数概率也不会改变。

0 投票
0 回答
850 浏览

r - 狄利克雷分布的 cdf

我想运行一个估计,假设我的变量是根据狄利克雷分布分布的。为此,我需要使用 cdf 函数。对于 R 中的所有分布,有各自的 r,p 和 d 函数产生随机变量,pdf 和 cdf。然而,对于 Dirichlet,我只能找到随机数生成器和 pdf。是否有类似的 R 包提供 cdf?

非常感谢,

0 投票
1 回答
4178 浏览

bayesian - 狄利克雷多项式 WinBUGS 代码

我正在尝试使用 BUGS 编写狄利克雷多项式模型。基本上我有 18 个地区和每个地区 3 个类别。例如,区域 1:0.50 属于 Low,0.30 属于 Middle,0.20 属于 High。该列表当然以不同的比例继续到第 18 区。我得到的唯一代码是这个

例如,我首先将其缩短为 3 个区域。单击“gen inits”后,它会显示“Dirichlet36”。请帮我编写代码。

0 投票
1 回答
960 浏览

pymc - PyMC 3 中的狄利克雷过程

我想实现 在 PyMC 3 中为贝叶斯半参数模型实现 Dirichlet 过程(来源:here )中引用的 Dirichlet 过程示例。

pymc.deterministic 在示例中,使用装饰器计算断棒概率:

您将如何在使用 Theano 进行梯度计算的 PyMC 3 中实现这一点?

编辑:我使用以下方法尝试了以下解决方案theano.scan

可悲的是,这真的很慢,并且没有获得合成数据的原始参数。

有没有更好的解决方案,这是否正确?

0 投票
1 回答
57 浏览

unit-testing - 狄利克雷分布单元测试

有没有人有可靠的数据可以用来为 Dirichlet 发行版的新实现编写一些单元测试?