问题标签 [scikit-plot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
917 浏览

python - 非常奇怪的 ROC 曲线

所以我有一个非常具有挑战性的数据集可以使用,但即使考虑到这一点,我得到的 ROC 曲线也看起来很奇怪而且看起来很错误。

下面是我的代码 - 在传递我的预测和基本事实标签后,我使用 scikitplot 库 (skplt) 绘制 ROC 曲线,所以我不能合理地弄错。我在这里错过了什么非常明显的东西吗?

下面是明显的二进制 ROC 曲线:

代码片段的 ROC 曲线

我知道我不能期望在如此具有挑战性的数据集上表现出色,但即便如此我也无法理解为什么我会得到这样一个二元结果,特别是对于各个类的 ROC 曲线。不,我无法获得更多数据,尽管我真诚地希望我能。如果这确实是有效的代码,那么我将不得不使用它,也许会报告微平均 F1 分数,这看起来还不错。

作为参考,在下面的代码片段中使用 sklearn 的 make_classification 函数,我得到以下 ROC 曲线:

使用 make_classification 随机生成数据集的 ROC 曲线

难道我做错了什么?或者考虑到这些特征,这是我应该期待的吗?

0 投票
0 回答
445 浏览

python - clf.fit(X, y) 没有以小值运行 - fit() 永远不会完成 - 潜在的 sklearn 错误:数据科学

这不是解决我的代码问题。(代码有效,但不适用于使用的数据)。这个问题直接与作为技术查询的 sklearn fit() 函数调用有关。

下面的模块调用。

代码应该适合数据(下面提供的链接)

产生如下图所示的图: 在此处输入图像描述

寻找有关以下代码的性能或错误问题的专家意见,请注意代码运行但它是我正在运行的数据。当我传入基于日志的 t-SNE 模型时,模型将不适合,我已经运行了几个小时,它应该在几秒钟内完成。

我尝试过的事情:等待它完成几个小时旋转一个盒子并支付谷歌为一个野兽盒子

我开始认为这可能与所有花车都太小有关。但是 float32 约束应该可以做到这一点。非常感谢任何建议或想法。

我在这里使用的数据(X)

对应的y值可以在这里获取

0 投票
2 回答
1993 浏览

python - 在 Python 中绘制累积增益曲线(ModuleNotFoundError:没有名为“scikitplot”的模块)

我对数据科学和 python 很陌生。我正在尝试使用 scikitplot 绘制我在 Spyder (Python 3.6) 中构建的模型的累积增益曲线。但是,它不断返回错误:ModuleNotFoundError: No module named 'scikitplot'。

见下文:

我尝试在 anaconda 提示符下使用以下内容:

然而,这些都没有奏效。结果 anaconda 提示:

感谢任何可能知道我做错了什么的人。

0 投票
1 回答
1143 浏览

python - 如何在 Python 中将 2 条提升曲线的图合并为一个图

我生成了通过 2 个模型预测的答案的提升曲线:逻辑回归和决策树。我在两个单独的图表上得到 2 个单独的图。我需要一个描绘这两个图的图表。怎么做?

我在两个不同的图表上收到两个不同的图。我需要单个图表上的两个图。我该怎么办?或者我应该以某种方式使用不同的 Python 库?

0 投票
2 回答
164 浏览

jupyter-notebook - scikit-plot 缩放是错误的

我正在尝试在 jupyter 笔记本中绘制混淆矩阵,但绘图无法正确显示。

我的代码是:

这段代码产生了情节:

在此处输入图像描述

任何有关如何使绘图正确显示的建议将不胜感激。

查尔斯

0 投票
3 回答
3903 浏览

python - 在 scikitplot 中仅绘制 1 类与提升曲线中的基线和累积增益图

我正在研究广告活动的倾向建模问题。我的数据集由历史上点击过广告的用户和未点击过的用户组成。

为了衡量我的模型的性能,我使用 sklearn 绘制了累积增益和提升图。下面是相同的代码:

我得到的图显示了 0 类用户和 1 类用户的图表样本累积增益曲线示例提升图

我只需要根据基线曲线绘制 1 类曲线。有没有办法我可以做到这一点?

0 投票
1 回答
351 浏览

python - 绘制混淆矩阵

我正在尝试使用scikitplot.metrics.plot_confusion_matrix以下代码段来绘制混淆矩阵-

但是,我并没有完全得到如图所示的预期结果(不知何故,文本与轴重叠)。我怎样才能使它整洁干净?

在此处输入图像描述

0 投票
1 回答
527 浏览

python - 混淆矩阵预测标签

我正在使用以下一段 python 代码来生成归一化的混淆矩阵

这给了我这里显示的情节。但是,我想在 x 轴上旋转纹理(预测值,即中性、快乐、悲伤)。我希望旋转 x 轴上的预测值而不是水平线(如此处所示并保持真实标签原样(水平)。我们如何在 Python 中做到这一点?

0 投票
1 回答
168 浏览

subplot - 如何将包含 6 个图表的子图制作成来自 scikitplot 库的图表

我有六个模型,想用 ROC 图评估它们

现在我正在为此制作图表

在此处输入图像描述

但我想要次要图表!不幸的是,这行不通。我需要这个解决方案来解决 scikitplot 图表的一系列问题。

在此处输入图像描述

0 投票
0 回答
137 浏览

python - 为什么 Scikit-Learn 中没有实现宏观平均 PR 曲线?

对于多类分类,scikit-learn 示例中的 PR 曲线(PR 曲线示例)和使用 scikit-plot 绘制 PR 曲线的功能(API 参考)都只实现了微平均 PR 曲线。而 ROC 曲线的相应示例和函数实现了微观平均和宏观平均曲线。

没有实施宏观平均 PR 曲线是否有原因?