0

我正在尝试使用 entity_ruler 构建“命名实体”的自定义列表,同时遵循API

但是我面临一个问题:我可以构建一个命名实体来引用另一个也在 entity_ruler 中定义的实体吗?

举个例子,假设我想将实体构建Agreement为一些固定的表达式,并将实体构建AgreementDate为一个Agreement后跟另一个表达式:下面的片段可以正确设置 spacy 吗?因为输出不是我所期望的。

patterns = [
    {'label': 'Agreement', 'pattern': [{'LOWER': 'license agreement'}]},
    {'label': 'Agreement', 'pattern': [{'LOWER': 'agreement'}]},
    {'label': 'Agreement', 'pattern': [{'LOWER': 'commencement'}]},
    {'label': 'Agreement', 'pattern': [{'LOWER': 'parties'}]},
    {'label': 'AgreementDate', 'pattern': [{'ENT_TYPE': 'Agreement'}, {'LOWER': 'date'}]},
]
nlp = spacy.load('en_core_web_sm')
entity_ruler = nlp.add_pipe('entity_ruler', config={
    'validate': True,
    'overwrite_ents': True
})
entity_ruler.initialize(lambda: [], nlp=nlp, patterns=patterns)
for ent in nlp('''Commencement Date
license agreement date''').ents:
    print(f'{ent.text:40} {ent.label_:40}')
Commencement                             Agreement                               
agreement                                Agreement                               
4

1 回答 1

1

实体标尺模式仅与实体标尺组件开始运行之前设置的注释匹配,但如果将最终模式移动到第二个实体标尺中(使用自定义组件名称),您可以执行此操作。

于 2021-11-11T09:37:50.263 回答