问题标签 [dirichlet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
77 浏览

r - 使用 R 测试 Dirichlet 平铺的平铺

所以我可以拿分并使用R图书馆deldirspatstat::dirichlet找到这些点的狄利克雷镶嵌。

现在我有一个点不在集合中,我想知道形成狄利克雷图块的点的索引,我的非设置点在内部。我可以通过了解磁贴标签(或索引)到达那里。

是否有任何库或方法可以做到这一点?我在想spatstat,但还没有找到东西。

0 投票
0 回答
279 浏览

python - 基于 Python 代码在 R 中绘制断棒过程

我想将 Python 代码复制到 R 代码中关于 Stick-break 过程,这是 Dirichlet Process 的构造方案之一。但是,我在 R 中绘制的图完全不同,因为 DP 样本分布不在基本分布 H 周围。

参考 Python 代码来自Austin Rochford 的博客

右侧的图是 Python 代码中的结果。

α=50 的 DP

我试图将其转换为 R 代码:

我画的图是 dp,alpha=50:

α=50 的 DP

如何修改 R 代码以提供与 Python 代码相似的结果?

0 投票
0 回答
441 浏览

pymc3 - 如何在pymc3中模拟伯努利斯的混合物

我正在尝试使用 Dirichlet Processes 来识别我的二进制数据中的集群。我使用本教程作为起点,但本教程的框架是结果是一维正态或泊松分布变量的混合。

我每次观察有多个二进制变量,在下面的示例代码中为 5,并且无法确定如何构建最终混合步骤。从本报告中的数学描述中,我可以看到总体可能性只是所有分配集群的可能性的乘积。

我没有明确地形成集群标签(使用Categorical(w))作为pm.Mixture分布处理这个,但无法弄清楚如何将可能性制定为 pymc3 理解的概率模型。

编辑 28/01/2019

我提供了一个自定义似然函数,它在从分类分布中绘制组件标签后简单地计算伯努利混合似然。然而,虽然模型现在正在做某事,但它无法识别 3 个组,而只能找到 2 个。我无法判断它是否只需要更多采样/更有效的参数化,或者模型定义是否有缺陷。

w 轨迹应该是静止的吗?

痕迹

为什么没有订购组件?在我见过的其他示例中,它们通常按尺寸降序排列

成分

下面的代码显示了 2 个主要组件的 mu Bernoulli 参数值,但这些值与实际值相差甚远

用于模拟数据的实际参数:

0 投票
1 回答
62 浏览

bayesian - Dirichlet 参数在 JAGS 中不更新

我正在尝试在 JAGS 中运行分层 Dirichlet 模型,但我没有更新并且必须做错事。我尝试用伽玛分布来近似它:

0 投票
0 回答
119 浏览

r - 3d 三元散点图

我希望能够创建一个由四个变量组成的图。第四个变量只是 1.0 减去前三个。

我可以生成一些包含三个变量的高质量图,但是会进行一些调整以确保子组合总和为 1.0。这并不理想并且会扭曲数据。另外我想自定义每个轴的颜色。

但是通过简单地提供完整列表,我可以生成一个交互式绘图,但它缺少所需的元素:

1) 符号的颜色和形状都相同
2) 没有轴网格(但这些在 3d 图中可能会令人困惑?)
3) 没有轴标签

有谁知道产生更类似于 2d(使用 3 个变量)图的 3d(使用 4 个变量)的替代函数?谢谢。

编辑:我真的没有资格采用一个包。)o:有谁知道替代软件包/软件可以实现接近我的愿望?CoDaPack 软件很接近,但不是很可配置。http://ima.udg.edu/codapack/

CoDA 生成的 3D 三元图

0 投票
1 回答
277 浏览

python - 使用 dirichlet 先验从 pyMC3 绘制分类向量

我想绘制分类向量,其先验是狄利克雷分布的乘积。类别是固定的,类别向量中的每个元素对应于不同的 Dirichlet 先验。这是一个长度为 33 的类别向量,有 4 个类别,使用 Dirichlet 进行先验设置。

然而,这种方法很麻烦,因为我必须做一些数组索引才能得到分类向量。有没有更好的方法来做到这一点?

0 投票
3 回答
949 浏览

javascript - 如何获得总和等于M的N个随机整数

我想列出 N 个随机 INTEGER 数,其总和等于 M 数。

我在 Python 中使用了 numpy 和 dirichlet 函数,但这会生成双随机数数组,我想生成整数随机数。

解决方案可以使用其他分布,感觉就是解决问题。

0 投票
1 回答
2130 浏览

dirichlet - numpy.random.dirichlet 做什么?

我需要一个 Dirichlet 分布,我正在使用 numpy.random.dirichlet。当我根据 Dirichlet PDF 公式给出 alpha=[1,1,1,1] 时,它应该产生一个统一的函数。但它没有给我一个统一的向量。有人知道为什么吗?

0 投票
1 回答
125 浏览

java - 如何使用语言模型扩展 Lucene?

各位晚上好!所以,我有作为项目“使用语言模型扩展 lucene”,我尝试在我的代码中添加 2、3 行,如下所示:在 search.java

在 index.java 上

但我不认为这很容易!也许我应该写一个算法之类的?有答案的请帮帮我谢谢^_^

0 投票
0 回答
303 浏览

machine-learning - LDA:使用 u_mass v c_v 的一致性值

我目前正在尝试记录和绘制各种主题数值的连贯性分数,以确定最适合我的语料库的主题数量。在使用 u_mass 进行几次试验后,数据被证明是不确定的,因为分数不会在特定主题编号附近保持平稳。我知道使用 u_mass 时 CV 的范围是 -14 到 14,但是我的值范围是 -2 到 -1,并且无法选择准确的主题编号。由于这些问题,我尝试使用 c_v 而不是 u_mass 但收到以下错误:

这是我计算相干值的代码

如果有人可以帮助解决我的 c_v 或 u_mass 问题,将不胜感激!谢谢!