我正在尝试从python CRFsuite获取混淆矩阵。
这是我的代码:
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test, pred_y, normalize='true', labels=lables)
错误:
ValueError: You appear to be using a legacy multi-label data representation. Sequence of sequences are no longer supported; use a binary array or sparse matrix instead - the MultiLabelBinarizer transformer can convert to this format.
我尝试使用MultiLabelBinarizer()
,但仍然无法获得混淆矩阵。
在谷歌搜索后,我找到了这个答案,它说对于混淆矩阵函数,你必须展平y_test
and pred_y
。我在这里查看了 CRFsuite 的其他指标的源代码,它们确实使用了一个 fallaten 函数:
def _flattens_y(func):
@wraps(func)
def wrapper(y_true, y_pred, *args, **kwargs):
y_true_flat = flatten(y_true)
y_pred_flat = flatten(y_pred)
return func(y_true_flat, y_pred_flat, *args, **kwargs)
return wrapper
但是没有获取confusion matrix
.
和是y_test
嵌套pred_y
列表。
如何展平y_test
andpred_y
以获得混淆矩阵?
谢谢你。