到目前为止,我已经为另一篇文章和sklearn 文档提供了资源
所以总的来说,我想生成以下示例:
X = np.matrix([[1,2],[2,3],[3,4],[4,5]])
y = np.array(['A', 'B', 'B', 'C', 'D'])
Xt = np.matrix([[11,22],[22,33],[33,44],[44,55]])
model = model.fit(X, y)
pred = model.predict(Xt)
但是对于输出,我希望看到每个观察 3 列作为输出pred
:
A | B | C
.5 | .2 | .3
.25 | .25 | .5
...
以及在我的预测中出现的每个类别的不同概率。
我相信最好的方法Multilabel classification
来自我上面提供的第二个链接。此外,我认为跳入下面列出的模型multi-label
之一可能是个好主意:multi-output
Support multilabel:
sklearn.tree.DecisionTreeClassifier
sklearn.tree.ExtraTreeClassifier
sklearn.ensemble.ExtraTreesClassifier
sklearn.neighbors.KNeighborsClassifier
sklearn.neural_network.MLPClassifier
sklearn.neighbors.RadiusNeighborsClassifier
sklearn.ensemble.RandomForestClassifier
sklearn.linear_model.RidgeClassifierCV
Support multiclass-multioutput:
sklearn.tree.DecisionTreeClassifier
sklearn.tree.ExtraTreeClassifier
sklearn.ensemble.ExtraTreesClassifier
sklearn.neighbors.KNeighborsClassifier
sklearn.neighbors.RadiusNeighborsClassifier
sklearn.ensemble.RandomForestClassifier
但是,我正在寻找有更多信心和经验以正确方式做到这一点的人。感谢所有反馈。
-bmc