给定来自 Mahout LDA CVB 程序/离线批处理执行的主题模型,我喜欢使用模型/在线 Web 服务调用来推断新文档。
这些文档对于新的和推断的帮助并不大。* https://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/clustering/lda/cvb/TopicModel.html * http://svn.apache.org/viewvc/mahout/trunk /core/src/main/java/org/apache/mahout/clustering/lda/cvb/TopicModel.java?view=markup
我什至在 Internet 或其他地方都找不到任何示例代码。
在这里,我想我可能想用Java代码做,
TopicModel model = new TopicModel();
Vector documentInTermFrequency = new RandomAccessSparseVector();
documentInTermFrequence.setQuick(termIdX, 10);
documentInTermFrequence.setQuick(termIdY, 20);
Vector docTopic = new DenseVector(new Double[10] { 0.1, 0.1, ..., 0.1 }); // 0.1 probabilities
Vector documentTopicInference = model.infer(documentInTermFrequence, docTopic);
我没见过有人尝试过这样的事情吗?有没有人尝试过这样的事情?
任何建议或指针将不胜感激。