我刚刚测试了使用 Apache Mahout 在 30 个文档的语料库上构建潜在狄利克雷分配模型。我没有在系统上安装 Hadoop,这就是为什么本地执行 Mahout 会产生结果模型的原因。我想访问模型参数,如估计的 \alpha、\beta、\Phi、\Theta
我怎样才能访问这些?
/mahout lda -i /tf-vectors -o -k 4-v 27
我可以看到学习算法的每次迭代(我假设)都有文件夹。每个都有一个文件 part-r-0000,我不知道如何访问。
任何帮助将不胜感激。