1

这是我将使用的数据集的一部分:

 u'tff prep normalized clean water permability ncwp result outside operating range',
 u'technician inadvertently omitted documenting initial room \u201c cleaned sanitized field form',
 u'sunflower seed observed floor room 1',

这是我正在使用的代码:

tfidf_model = vectorizer.fit_transform(input_document_lower)
tfidf_feature_names = vectorizer.get_feature_names()
nmf = NMF(n_components=no_topics, random_state=1, alpha=.1, l1_ratio=.5, init='nndsvd').fit(tfidf_model)

像标题所述,我收到以下错误:

IndexError: index 4 is out of bounds for axis 1 with size 4

老实说,我不确定如何开始调试它。我使用相同的数据集构建了一个 LDA,没有任何问题。任何帮助将非常感激

4

3 回答 3

5

我认为 n_components 应该小于 (tfidf_model.shape[0], tfidf_model[1])。

于 2018-01-16T22:08:05.417 回答
0

您必须将 no_topics 变量设置为 tfidf_model.shape 的 x 坐标

于 2019-12-24T12:20:18.757 回答
0

正如 Yotaro 所说,n_components 需要相同或小于 no_topics

no_topics,单词 = tfidf_model.shape

nmf = NMF(n_components=no_topics, random_state=1, alpha=.1, l1_ratio=.5,init='nndsvd').fit(tfidf_model)

于 2018-08-22T22:28:12.300 回答