我正在做推文分类,其中每条推文都可以属于少数类别之一。训练集输出作为该样本属于每个类别的概率给出。例如:tweet#1:C1-0.6、C2-0.4、C3-0.0(C1、C2、C3 是类)
我打算使用使用 Scikit-learn 的朴素贝叶斯分类器。我在 naive_bayes.py 中找不到适合的方法,该方法采用每个类的概率进行训练。我需要一个分类器,它接受训练集每个类的输出概率。(即:y.shape = [n_samples, n_classes])
如何处理我的数据集以应用 NaiveBayes 分类器?