0

我正在使用 spaCy 尝试在句子中提取 ORG 实体标签。但是,它并没有拾取所有标签,而且它拾取的标签因组织名称的书写方式而异。例如:

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')    # I am using `.render` as I am in a notebook

生成: 在此处输入图像描述 这显然是遗漏的Facebook

尽管

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft Inc, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')

生成: 在此处输入图像描述 现在缺少GoogleFacebook

关于我做错了什么的任何想法?

4

1 回答 1

1

你没有做错任何事,只是模型并不完美。请参阅Github 上的这个问题,它解释了这只是统计模型工作方式的一部分。

请注意,您的示例似乎与我最新的大型英语模型一样工作。

于 2021-08-03T07:07:51.237 回答