0

这听起来可能很愚蠢!但是,我想找到任何简单的例子来参考!有人可以举一个使用java打印混淆矩阵的例子吗?

像这样的东西(输出):

p\a   Head    Tail
Head    1      4
Tail    4      1

假设像这样存储在 HashMap 中的数据

HashMap<String,Integer>
String = "Head, Tail"
Integer = 4

更新(示例代码):

public static void main(String[] args) {

        HashMap<String,Integer> cmatrix = new HashMap<String,Integer>();

        //the string part can hold more the 2 values, all separated with comma
        cmatrix.put("tail, head", 1);
        cmatrix.put("head ,tail", 4);
        cmatrix.put("tail, tail", 1);
        cmatrix.put("head, head", 4);

        for (Map.Entry entry : cmatrix.entrySet()) {
            System.out.println(entry.getKey() +" : "+entry.getValue());
        }
    }

谢谢!

4

2 回答 2

2

为了简化代码,我们假设源数据中没有空格:

cmatrix.put("tail,head", 1);
cmatrix.put("head,tail", 4);
cmatrix.put("tail,tail", 1);
cmatrix.put("head,head", 4);

首先,我们需要收集类的名称:

Set<String> classNames = new HashSet<String>();
for(String key : cmatrix.keySet()) {
    String[] classes = key.split(",");
    if(classes != null && classes.length > 0) {
        classNames.addAll(Arrays.asList(classes));
    }
}

接下来,对类名进行排序:

List<String> sortedClassNames = new ArrayList<String>();
sortedClassNames.addAll(classNames);
Collections.sort(sortedClassNames);

然后打印出标题行。

System.out.print("p/a");
for(String predictedClassName : sortedClassNames) {
    System.out.print("\t" + predictedClassName);
}
System.out.println();

然后打印出每一行:

for(String actualClassName : sortedClassNames) {
    System.out.print(actualClassName);
    for(String predictedClassName : sortedClassNames) {
        Integer value = cmatrix.get(actualClassName + "," + predictedClassName);
        System.out.print("\t");
        if(value != null) {
            System.out.print(value);
        }
    }
    System.out.println();
}

我将把输出的“美化”留给读者作为练习。

于 2014-11-11T04:08:39.087 回答
1

混淆矩阵非常复杂,值得研究开源解决方案。一种可以轻松集成到代码中而无需添加大量不必要的附加功能的方法就在这里。其他数据科学/nlp 包也有实现作为其分发的一部分,即使使用整个库太多,源文件也可以指导如何做到这一点。

使用其中之一的好处是它们还免费为您提供一些指标以及占位符矩阵,例如 Cohen 的 Kappa 度量和更基本的精度/召回/和 F 度量分数。

于 2016-05-17T21:56:25.373 回答