我正在尝试为我的文本注释器构建质量测试框架。我使用GATE编写了我的注释器
我确实为每个输入文档提供了黄金标准(人工注释)数据。
这是用于质量保证的门资源列表GATE Embedded API for the measure
到目前为止,我能够获得包含FP,TP,FN, Precision, Recall and Fscores
使用
AnnotationDiffer中的方法的性能矩阵
现在,我想深入研究。我想根据每个文档查看单个 FP、FN。即我想分析每个 FP 和 FN,以便我可以相应地修复我的注释器。
我没有在 GATE 的任何类中看到任何函数,例如返回List<Annotation>
FP 或 FN 的 AnnotationDiffer。他们只返回 FP 和 FN 的计数
int fp=annotationDiffer.getFalsePositivesStrict()
int fn=annotationDiffer.getMissing()
在我继续创建自己的实用程序来获取List<Annotation>
FP 和 FN 以及几个周围的句子之前,为每个输入文档创建一个 HTML 报告以进行分析。我想检查是否已经存在类似的东西。