1

我是主题建模的新手,我正在尝试使用 Mallet 库,但我有一个问题。

我正在使用 LDA 的简单并行线程实现来查找某些实例的主题。我的问题是ParallelTopicModel中的估计函数是什么?

我在API中进行了搜索, 但没有描述。我也读过这个教程

有人能解释一下这个功能是什么吗?

编辑

这是我的代码示例:

 public void runModel(Sting [] str){    
    ParallelTopicModel model = new ParallelTopicModel(numTopics);
    ArrayList<Pipe> pipeList = new ArrayList<Pipe>();
    // Pipes: lowercase, tokenize, remove stopwords, map to features
    pipeList.add(new CharSequenceLowercase());
    pipeList.add(new CharSequence2TokenSequence(Pattern.compile("\\p{L}[\\p{L}\\p{P}]+\\p{L}")));
    pipeList.add(new TokenSequence2FeatureSequence());
    InstanceList instances = new InstanceList(new SerialPipes(pipeList));
    instances.addThruPipe(new StringArrayIterator(str));

     model.addInstances(instances);
     model.setNumThreads(THREADS);
     model.setOptimizeInterval(optimizeation);
     model.setBurninPeriod(burninInterval);
     model.setNumIterations(numIterations);
     // model.estimate();
 }
4

1 回答 1

3

estimate()运行 LDA,尝试根据您已经设置的数据和设置来估计主题模型。

查看main()的功能以获取ParrallelTopicModel有关估计模型所需的灵感。

于 2014-11-14T03:45:53.007 回答