我正在使用熊猫管道研究 tf-idf。我正在使用SMARTlnc.ltc
表示法的称重方案。
query = 'some string'
pipeline = Pipeline([
('vect', CountVectorizer(stop_words='english')),
('tfidf', TfidfTransformer(norm='l2', use_idf=False, smooth_idf=False, sublinear_tf=True)),
])
doc_vectors = pipeline.fit_transform(data).toarray()
query_vector = pipeline.transform([query]).toarray()
对于文档向量,我想设置use_idf=False
完成。但是如何设置use_idf=True
查询向量?
我尝试直接更改use_idf
参数,但它不起作用。