12

我正在 Spark ML 中使用随机森林进行多类预测。

对于 spark ML 中的这个 MulticlassClassificationEvaluator(),是否可以通过每个类标签获得精度/召回率?

目前,我只看到所有班级的精确度/召回率相结合。

4

2 回答 2

1

直接使用org.apache.spark.mllib.evaluation.MulticlassMetrics,然后获取可用的指标——

// copied from spark git
val predictionAndLabels =
      dataset.select(col($(predictionCol)), col($(labelCol)).cast(DoubleType)).rdd.map {
        case Row(prediction: Double, label: Double) => (prediction, label)
      }
    val metrics = new MulticlassMetrics(predictionAndLabels)
于 2020-05-24T07:04:19.107 回答
0

使用内置方法查看类文档,这似乎是不可能的。

尽管不完全是您要查找的内容,但您可以在方法中使用weightedPrecisionand 。这至少可以解决阶级失衡问题。weightedRecallmetricName

于 2018-08-02T08:18:30.940 回答