1

我正在尝试用 mahout 构建分类器。模型建立后。我必须将目标文档“提供”给模型并获得分类结果。

我检查了 mahout 源代码中的测试用例,它使用具有固定数量字段的 DenseVector。但是,我使用 mahout 对文本文档进行分类,输入是一些字符串(或包含字符串的数组)。如何将其转换为有效的“矢量”实例。

我尝试了 StaticWordEncoder 和 RandomAccessSparseVector,但结果不正确。无法弄清楚为什么。有点绝望。

4

1 回答 1

0

您必须将文档解析为单词并从中填充向量。

我建议在尝试之前阅读诸如Mahout In Action之类的内容以获得更多背景知识。

于 2012-09-04T09:35:45.327 回答