Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
在 Gensim 的 Doc2Vec 中,如何结合句子向量来为段落制作单个向量?我意识到你可以训练整个段落,但显然训练单个句子、上下文等会更好。(我认为......?)
有什么建议或正常用例吗?
另外,我将如何从模型中检索句子/段落向量?
Doc2Vec 的架构本身不涉及任何解析,因此对整个段落进行训练/测试是有意义的。
在原始论文中,作者展示了将整个段落视为一个句子的结果,优于现有技术。