python - spaCy没有在句子中提取所有ORG标签

Question

我正在使用 spaCy 尝试在句子中提取 ORG 实体标签。但是，它并没有拾取所有标签，而且它拾取的标签因组织名称的书写方式而异。例如：

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')    # I am using `.render` as I am in a notebook

生成：这显然是遗漏的Facebook

尽管

import spacy
from spacy import displacy

doc = nlp("Apple, Microsoft Inc, Google, and Facebook are all techo companies from the USA")
displacy.render(doc, style='ent')

生成：现在缺少Google和Facebook。

关于我做错了什么的任何想法？

score 1 · Accepted Answer

你没有做错任何事，只是模型并不完美。请参阅Github 上的这个问题，它解释了这只是统计模型工作方式的一部分。

请注意，您的示例似乎与我最新的大型英语模型一样工作。

python - spaCy没有在句子中提取所有ORG标签

1 回答 1

Related

Reference