1

DKpro 中已经有很多标记器,例如斯坦福、opennlp 等,但我想知道如何在 DKpro-core 中实现 Fair NER 标记器?

4

2 回答 2

2

现有的 DKPro 核心集成标记器,例如 Stanford、OpenNLP 等,要么基于 Java,要么兼容 Java。然而,天赋 NER 标记器模型是用 python 开发的。因此,要将它们与 DKPro 核心连接起来需要一个中间件工具。

DKPro Cassis是一个 UIMA CAS 处理库,用 Python 编写(也可作为pypi 项目提供),可以直接使用 flair 组件,例如 flair NER tagger。

DKPro Cassis 可以导入 DKPro 核心组件生成的 Cas 对象,并使用 flair ner 提供的标签对 SofA 进行注释。注释后,Cas 对象可以导出回 DKPro 核心。

上述分析的 PoC 正在进行中,将很快在此处更新。

于 2020-05-26T15:29:36.713 回答
2

将 FlairNLP 与 DKPro 集成的 PoC 在此处制作

如前所述,DKPro 生成的 CAS 对象是在 DKPro cassis 的帮助下导入的。SoFA 字符串由 FlairNLP 注释。NER 注释是根据 DKPro NER 注释映射的。CAS 被写回一个 xmi 文件,DKPro 可以读回该文件以进一步注释。

于 2020-08-10T02:33:09.290 回答