-1

我编写了一个代码来对 Java 中的一组数据进行聚类。我正在使用 Apache Mahout 来构建集群。这是我的一段代码:

        Configuration conf = new Configuration();
        Path input = new Path("C:\\DATA\\input.txt");
        Path clusters = new Path("C:\\DATA\\clusters.txt");
        Path output = new Path("C:\\DATA\\output.txt");
        org.apache.mahout.common.distance.DistanceMeasure measure;
        String delta = new InterruptedException().toString();
        org.apache.mahout.clustering.kmeans.KMeansDriver myK = new KMeansDriver();
        myK.buildClusters(conf, input, clusters, output, measure, 100, delta, true);

但是在创建“度量”参数时出现错误:“变量度量可能尚未初始化”。

这是函数 buildClusters 的文档:https ://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/clustering/kmeans/KMeansDriver.html

那么,如何定义“度量”的真正价值呢?

4

1 回答 1

1

DistanceMeasure链接)只是一个接口。您需要使用接口的实现之一,例如CosineDistanceMeasureEuclideanDistanceMeasure

顺便说一句,我想知道为什么你的 delta 是这样定义的:String delta = new InterruptedException().toString();

delta定义为收敛增量值,在内部被解析为双精度值。

于 2012-11-06T10:33:39.820 回答