我对词向量的工作方式感到非常困惑,特别是关于 spacy 的实体链接(https://spacy.io/usage/training#entity-linker)。
将实体添加到知识库时,参数之一是 entity_vector。你怎么得到这个?我试过做
nlp = spacy.load('en_core_web_sm')
kb = KnowledgeBase(vocab = nlp.vocab, entity_vector_length = 96)
for n in m_yentities:
kb.add_entity(entity = n, freq = ___, entity_vector = **nlp(n).vector**)
** 代码给了我长度为 96 的向量,所以这就是我使用的entity_vector_length
,尽管在示例中他们使用 3。我只是想知道我的方法是否可以,但我对此有点困惑。