...或者性别信息是否足够?更具体地说,我很想知道我是否可以减少斯坦福核心 NLP 加载的模型数量以提取共指。我对实际的命名实体识别不感兴趣。
谢谢
...或者性别信息是否足够?更具体地说,我很想知道我是否可以减少斯坦福核心 NLP 加载的模型数量以提取共指。我对实际的命名实体识别不感兴趣。
谢谢
根据描述与斯坦福 CoreNLP 打包的 coref 系统的 EMNLP 论文,命名实体标签仅用于以下 coref 注释传递:精确构造、轻松头部匹配和代词 (Raghunathan 等人 2010)。
您可以使用dcoref.sievePasses配置属性指定要使用的通道。如果你想要共指但你不想做 NER,你应该能够在没有 NER 的情况下运行管道,并指定 coref 系统应该只使用不需要 NER 标签的注释传递。
但是,生成的 coref 注释会影响召回率。因此,您可能需要做一些实验来确定注释的质量下降是否是您在下游使用它们的问题。
一般来说,是的。首先,您需要命名实体,因为它们充当候选先行词或代词所指的目标。许多(大多数?)系统一步执行实体识别和类型分类。其次,实体的语义类别(例如人、组织、位置)对于构建准确的共指链很重要。