问题标签 [iris-dataset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
189 浏览

r - 如何在 R 中定位使用 kNN 错误分类的单个样本?

使用 R 中的 Iris 数据集,我正在使用 kNN 进行分类。我有兴趣找到使用测试集错误分类的观察结果。我能够生成散点图,可以直观地看到被错误分类的观察结果。但是,我怎样才能找到并列出所有被错误分类的观察结果。我已经包含了我用来获取下面散点图的代码,该代码来自https://rpubs.com/Tonnia/irisknn

0 投票
1 回答
64 浏览

classification - 在分类中使用线性判别分析和 k 最近邻时,哪个更好?

我目前正在对 Iris 数据集进行分类。我使用 LDA 和 kNN 方法对数据进行分类。我发现两者都非常准确,无法决定哪个更适合使用?我的第一个想法是 kNN,因为 LDA 假设数据具有多元正态分布。但是,很想知道更多理论背后哪个更好。

0 投票
1 回答
145 浏览

pandas - 如何将此 scikit-learn 部分转换为 pandas 数据框?

我正在尝试将此 Python 代码部分转换为 pandas 数据框:

我想在本地机器上导入Iris 数据,而不是从 Scikit 库中加载数据。您的友好建议将不胜感激。

0 投票
3 回答
154 浏览

r - 在 R 中分配数据框时,为什么会出现错误“'closure' 类型的对象不是子集”?

我正在使用 R 中包含的 iris 数据集。首先,我从物种列中使用“virginica”和“not virginica”创建了新数据,以便重命名每个不是 virginica 的物种:

然后,当我尝试在下面的代码中创建一个数据框来代表所有种类的弗吉尼亚州时,我"object of type 'closure' is not subsettable"df(Species == "virginica", ).

我从理论上知道这个错误意味着什么,但我不明白它如何应用于这条线。我尝试将括号更改为方括号并使用iris$Species == "virginica"而不是df$Species == "virginica",但都没有奏效。这是怎么回事?

0 投票
1 回答
651 浏览

r - R 中 Ranger 的 SHAP 重要性

有一个二元分类问题:如何获得 Ranger 模型的变量的 Shap 贡献?

样本数据:

我已经尝试了几个库(DALEX、、、、),shapr但我没有得到任何解决方案。fastshapshapper

我希望得到像SHAPforxgboostxgboost 这样的结果:

  • 其输出shap.values是变量的形状贡献
  • shap.plot.summary
0 投票
2 回答
364 浏览

python - 如何绘制具有不同内核的 SVM 的决策边界?(3个类,3个特征)

我正在尝试使用SVM不同的内核(如rbf,polylinear.

我正在使用iris在线可用的数据集,其形状为 150 * 4,所以我放弃了第 4 个特征,现在它的形状为 150 * 3。请注意,每个类现在包含 50 个样本,按出现的顺序具有 3 个特征。

class1 = iris[:50, :], class2 = iris[50:100, :], class3 = iris[100:150, :]

我已经用“线性”内核绘制了一个,我不知道如何用其他内核绘制。我已经搜索了几天,没有找到任何我能理解或可以使用的东西。

这是区分不同类别的两个表面

线性核支持向量机的决策边界

现在我需要绘制 3 个类以及通过使用其他内核将它们分开的表面(即 'rbf'、'poly' 和 'degree=3')

0 投票
1 回答
312 浏览

python - 虹膜数据集的散点图

我是数据科学的新手。我编写了这个脚本来绘制所有不同类型的虹膜数据集散点图。尽量不要自己策划一些事情。如何优化我的代码?

'''Python

''' 在此处输入图像描述 这是输出

如果是你,你会怎么写?

我很感激任何帮助。

0 投票
0 回答
524 浏览

python - 虹膜数据集的可视化和朴素贝叶斯模型

有很多方法可以可视化数据集。我想在这里将所有这些方法放在一起,并为此选择iris了数据集。为了做到这一点,这些被写在这里。

我会使用pandas“可视化”或seaborn“.

结果如下:

在此处输入图像描述

其情节如下图所示: 在此处输入图像描述

这将绘制以下图: 在此处输入图像描述

还有另一个我认为使用最少和最重要的情节是以下情节:

这会在您的浏览器中绘制并需要 HTML5,您可以随心所欲地查看它。下一个数字就是那个。请记住,这是一个散点图,每个球的大小都显示了四个特征的数据,petal_width因此所有四个特征都在一个图中。

在此处输入图像描述

朴素贝叶斯是一种用于二分类(二分类)和多分类问题的分类算法。它被称为朴素贝叶斯,因为每个类别的概率计算都被简化以使其计算易于处理。与其尝试计算每个属性值的概率,不如假定它们在给定类值的情况下是条件独立的。这是一个非常强的假设,在真实数据中是最不可能的,即属性不交互。然而,该方法在这种假设不成立的数据上表现得非常好。

这是开发模型来预测该数据集的标签的一个很好的例子。您可以使用此示例来开发每个模型,因为这是它的基础。

添加您认为必要的任何内容,例如 3d 中的决策边界是我以前没有做过的。

在此处输入图像描述

0 投票
2 回答
130 浏览

r - biplot princomp 和 biplot 中的颜色

如何使用 princomp 和 biplot 为 biplot 中的 iris 数据集的种类着色不同的颜色。最好的

0 投票
1 回答
443 浏览

python - 如何在散点图中显示图例以区分类

我正在研究来自 sklearn 的 iris 数据集。您可能知道 iris 数据集有 3 个类 ['setosa'、'versicolor'、'virginica']。我为这个数据集做了一个散点图。详细情况如下

萨克特图:

我有散点图,你可以看到黄色、绿色和紫色的点。我想知道哪个颜色点属于哪个类('setosa'、'versicolor'、'virginica')。我想显示图例,以便我知道哪种颜色代表哪个类