0

我正在使用熊猫管道研究 tf-idf。我正在使用SMARTlnc.ltc表示法的称重方案。

query = 'some string'
pipeline = Pipeline([
    ('vect', CountVectorizer(stop_words='english')),
    ('tfidf', TfidfTransformer(norm='l2', use_idf=False, smooth_idf=False, sublinear_tf=True)),
    ])
doc_vectors = pipeline.fit_transform(data).toarray()
query_vector = pipeline.transform([query]).toarray()

对于文档向量,我想设置use_idf=False完成。但是如何设置use_idf=True查询向量?
我尝试直接更改use_idf参数,但它不起作用。

4

0 回答 0