我相信支持多标签分类,我不必使用 OneVsRestClassifier SGDClassifier()
。检查这个loss='log'
现在,我的数据集非常大,我正在使用HashingVectorizer
并将结果作为输入传递给SGDClassifier
. 我的目标有 42048 个特征。
当我运行它时,如下所示:
clf.partial_fit(X_train_batch, y)
我得到:ValueError: bad input shape (300000, 42048)
。
我也使用类作为参数如下,但仍然是同样的问题。
clf.partial_fit(X_train_batch, y, classes=np.arange(42048))
在 SGDClassifier 的文档中,它说y : numpy array of shape [n_samples]