我已经训练了大约 2300 个段落的段落向量(每个段落在 2000-12000 个单词之间),每个段落的向量大小为 300。现在,我需要推断我认为是段落的大约 100,000 个句子的段落向量(每个句子大约 10-30每个单词对应于之前已经训练的 2300 个段落)。
所以,我正在使用
model.infer_vector(sentence)
但是,问题是它花费的时间太长,并且它不需要任何参数,例如“ workers
”。!有没有办法可以通过线程或其他方式加快进程?我正在使用一台 8gb 内存的机器,当我使用
cores = multiprocessing.cpu_count()
结果是8。
我需要这个来回答多项选择题。此外,是否有任何其他库/模型doc2vec
可以帮助完成这项任务?
在此先感谢您的时间。