我正在使用在线 LDA 来执行一些主题建模任务。我正在使用基于论文 Original Online LDA 论文的核心代码:Hoffman、Blei 和 Bach,“Online Learning for Latent Dirichlet Allocation”。NIPS,2010。代码可在以下网址获得:https ://github.com/blei-lab/onlineldavb 。
我正在使用一组约 167000 个文档。该代码生成 lambda 文件作为我用来生成主题的输出(https://github.com/wellecks/online_lda_python,printtopics.py)。但我不确定如何使用它来查找新测试数据的主题(类似于 gensim 中的 model.get_document_topics )。请帮助解决我的困惑。