python - Sklearn TFIDF 矢量化线程安全吗？

Question

我已经构建了一个 TfidfVectorizer 并将其拟合到我的数据集

tfidf = TfidfVectorizer(tokenizer=ner_tokenizer, stop_words='english')
tfidf.fit(documents)

我现在想tfidf.transform()在多个线程中做。这样做安全吗？

score 2 · Accepted Answer

据我所知，transform只读取self但不修改它，所以它应该是线程安全的。

transform()在不修改的更深层次上调用,TfidfTransformer.transform()和间接,CountVectorizer.transform()和更多。可能还有一些魔法在发生，但我什么也找不到。check_is_fitted()CountVectorizer._validate_vocabulary()CountVectorizer._check_vocabulary()CountVectorizer._count_vocab()normalize()

python - Sklearn TFIDF 矢量化线程安全吗？

1 回答 1

Related

Reference