我正在尝试使用 entity_ruler 构建“命名实体”的自定义列表,同时遵循API
但是我面临一个问题:我可以构建一个命名实体来引用另一个也在 entity_ruler 中定义的实体吗?
举个例子,假设我想将实体构建Agreement
为一些固定的表达式,并将实体构建AgreementDate
为一个Agreement
后跟另一个表达式:下面的片段可以正确设置 spacy 吗?因为输出不是我所期望的。
patterns = [
{'label': 'Agreement', 'pattern': [{'LOWER': 'license agreement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'agreement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'commencement'}]},
{'label': 'Agreement', 'pattern': [{'LOWER': 'parties'}]},
{'label': 'AgreementDate', 'pattern': [{'ENT_TYPE': 'Agreement'}, {'LOWER': 'date'}]},
]
nlp = spacy.load('en_core_web_sm')
entity_ruler = nlp.add_pipe('entity_ruler', config={
'validate': True,
'overwrite_ents': True
})
entity_ruler.initialize(lambda: [], nlp=nlp, patterns=patterns)
for ent in nlp('''Commencement Date
license agreement date''').ents:
print(f'{ent.text:40} {ent.label_:40}')
Commencement Agreement
agreement Agreement