0

我有这些输入文件

id, feature1, feature2, ...
0, 0, 1, 1, 0, 0, 0, ...
1, 0, 0, 1, 0, 1, 0, ...
2, 1, 0, 0, 0, 0, 0, ...
3, 0, 0, 0, 0, 1, 0, ...

我想通过hadoop或mahout使用mapreduce作业来计算它的距离矩阵。但是 mahout 没有计算距离矩阵的方法。我该怎么办?

感谢您的帮助。

4

1 回答 1

1

您可以使用 Mahout 自己计算每条记录之间的距离。使用DistanceMeasure 类的距离方法,但您必须先将输入文件转换为 SequenceFile。

于 2013-09-17T03:11:07.487 回答