使用 linear_kernel 或cosine_similarity
forTfIdfVectorizer
时,我收到错误"Kernel dead, restarting"。
我正在为 TfID 方法 Vectorizer 和fit_transform
一些文本数据运行 scikit 学习函数,如下例所示,但是当我想计算距离矩阵时,出现错误"Kernel dead, restarting"。
无论我使用的是cosine_similarity
还是linear_kernel
函数:
tf = TfidfVectorizer(analyzer='word' stop_words='english')
tfidf_matrix = tf.fit_transform(products['ProductDescription'])
--cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)
--cosine_sim = cosine_similarity(tfidf_matrix, tfidf_matrix)
也许问题是我的数据大小?
我的 tiidf 矩阵是 (178350,143529),它应该生成一个 (178350,178350) cosine_sim 矩阵。