0

我在 hadoop 1.0.4 上运行 Mahout 0.7。我想查看主题建模任务的路透社数据集的结果。但是,当我在 Mahout 中使用 vectordump 工具时,我得到了一些无用的结果。我已阅读此示例的以下说明: 在 mahout 0.8 中运行 cvb
但在执行vectordump工具后,我在输出中收到一个巨大的文件,其中包含以下几行:{0.01:5.726429339702471E-12,0.05:6.196569958376538E-9,...} 我不确定这是否是我们应该看到的路透社数据集的实际输出。

4

2 回答 2

0

同样的事情发生了,解决方案很简单:在他们的 svn 服务器中获取他们的最新版本:http: //svn.apache.org/repos/asf/mahout/trunk

这是因为 Mahout 0.7 中存在 vectorSize 的错误。

于 2013-05-29T08:14:31.237 回答
0

我认为他们没有提供您正在寻找的那种类型的输出https://issues.apache.org/jira/browse/MAHOUT-1470

于 2014-04-02T14:15:25.593 回答