我有
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
# Train the vectorizer
text="this is a simple example"
singleTFIDF = TfidfVectorizer(ngram_range=(1,2)).fit([text])
singleTFIDF.vocabulary_ # show the word-matrix position pairs
# Analyse the training string - text
single=singleTFIDF.transform([text])
single.toarray()
我想将每个值关联到单个相应的功能中。现在单机是什么结构?如何将单个值的位置映射到特征?
如何解释词汇和 get_features() 的索引?他们有关系吗?根据文档,两者都具有索引功能。这很混乱?