1

我想将Mallet用作专家查找项目的一部分。我对 Mallet 几乎是新手,但我知道它从一组文档中训练主题。假设我有 50 个由 Mallet 训练的主题。我想计算这个概率:p(topic|q)或者p(q|topic)

q是查询。这是一个词(如算法,android等),我希望找到指定领域的专家。

当我读到这篇文章:如何使用槌获得词主题概率--word-topic-counts-file时,其中一位用户说我们可以使用选项来计算概率。假设我已经通过 Mallet 生成了这个文件。它具有以下结构:

0 android 2:21
1 is 3:3
.
.
.

我知道这种结构的语义,但我不知道如何计算给定查询的主题概率(即p(topic|q)或两者之一p(q|topic)

PS:我使用“任何一个”这个词是因为我不确定 mallet 会计算其中的哪一个

任何帮助,将不胜感激

4

1 回答 1

0

从GlieBrt 对链接问题的回答中获取此示例行

1 needham 19:2 17:1

这里 p(topic|q) 可以计算为

p(19|尼德姆) = 2/3 = 0.67

p(17​​|尼德姆) = 1/3 = 0.33

有了你自己的例子,它就更简单了:

0 android 2:21

p(2|机器人) = 1.0

于 2016-12-06T15:03:25.960 回答