我目前正在研究二进制 SVM 分类器。为了可视化分类器的工作原理,我想创建一个概率密度函数(用 scikit 计算)的直方图,它显示单个数据点的标量(无论它属于 0 类还是 1 类)。
请注意,在 SVM 中,分类器的“切割边缘”是 -1 和 1。该图很好地描绘了在 [-1,1] 处存在一些决策边界。
回到我的问题:我想分别为标签 0 和 1 的数据点着色以分析软边距(-1 和 1 之间的区域)
概率密度函数存储为np.array 对应的标签存储在 pandas数据框中。
如何链接数组和数据框,将类别 0 的数值绘制为 ie 'green' 而类别 1 绘制为 ie'blue' ?
代码:
plt.hist(decisions_function_cv, bins=500, color='navy')
我试图将两者保存在同一个数据帧中,但我无法解密我如何以上述预期方式将其编程到决策函数中:(
Some1 有一个聪明的方法?提前致谢!
编辑:示例代码:
概率的标量。事实。
np.array([.5,0.6,1,1,1,-1,-1,-1,-.5,-0.6])
带有相应标签的程式化数据框:
df['labels']
0 1.0
1 1.0
2 1.0
3 1.0
4 1.0
5 1.0
6 0.0
7 0.0
8 1.0
9 1.0
*类别 1 的数值应绘制为蓝色
类别 0 的数值应绘制为绿色