我正在尝试将 Spacy.io 与自定义管道一起用于语言处理,但似乎当我向管道添加自定义函数时,该进程仅在一个线程上运行。使用默认管道进程使用指定的所有线程。
这就是我定义管道的方式:
nlp = spacy.load(language, create_pipeline=custom_pipeline)
这是custom_pipeline
功能:
def custom_pipeline(nlp):
return (nlp.tagger, score_vocab_pipe)
这就是我运行管道的方式:
nlp.pipe(texts, batch_size=1000, n_threads=8)
自定义管道函数是否有任何必要条件来支持 spacy 的多线程?