0

我试图大致了解 sLDA 的工作原理。与 LDA 相比,它具有“与每个文档相关的响应变量”。每个文档是仅由训练集中的一个主题标记还是可能由多个主题标记?

如果它必须只使用一个主题作为一个文档的标签,是否还有另一个 LDA 模型将训练集中每个文档的多个标签作为输入?如果 sLDA 可能使用多个主题作为标签,是否有任何实现(在 Python、R、C/C++、Matlab 中)用于具有多标签的 sLDA?

4

1 回答 1

1

sLDA 有一个响应变量,它是一个标签,但这实际上与主题没有直接关系。主题的推断仍然与常规 LDA 完全相同,使用概率计算来构建 N 个主题。每个文档最终都有一个长度为 N 的向量,表示它“包含”每个主题的强度。在 sLDA 中,它更进一步——它还在模型内部将响应标签与主题相关联,以便能够根据其主题向量预测一个从未见过的文档的响应标签应该是什么。

于 2014-11-25T19:37:54.860 回答