-1

在 Lingpipe 的 EM 教程中,他们说可以在没有监督数据的情况下运行算法:

通过让初始分类器随机分配类别,可以以完全无监督的方式训练分类器。只有类别的数量必须是固定的。算法完全一样,收敛后的结果或者最大epoch数就是一个分类器。

但是他们的课程TradNaiveBayesClassifier需要有标签和无标签的语料库才能运行。如何修改它以在没有标记数据的情况下运行?

4

1 回答 1

0

EM 是一种概率最大似然优化算法。一般来说,它适用于无监督算法(用于聚类),例如 PLSA、高斯混合模型。

我认为 linepipe 文档是说您可以使用所有数据标签的随机初始化(每个数据的标签分布),然后输入 NB 以计算 ELBO(证据下限),然后将其最大化以更新参数。

简而言之,您将需要使用 NB 来编写 M 步骤 --- 更新模型参数。

于 2013-08-29T15:49:33.890 回答