问题标签 [iris-dataset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
285 浏览

r - 非重叠山脊线图 R

大家好,我正在查看 R 中的一些山脊线图,更具体地说是在“ggridges 简介”一文中,我的目标是制作这个图但没有重叠:

通过阅读同一篇文章,可以添加重叠:

但由于某种原因,我收到了这个错误:

谢谢

0 投票
1 回答
90 浏览

python - 使用逻辑回归预测鸢尾花种类

我有一个给定的代码,它根据花瓣长度和花瓣宽度告诉您来自 iris 数据集的 Iris 是否是 iris vireginica。但是我如何对一朵全新的花进行预测呢?

现在假设我有一朵新花,我测量:

  • 萼片长度:4.8
  • 萼片宽度:2.5
  • 花瓣长度:5.3
  • 花瓣宽度:2.4

当我尝试以下预测时,我收到一条错误消息: ValueError: X has 1 features per sample; 期待 2

所以我的问题是,我如何正确地在这里预测一朵新花以及它是什么种类?

0 投票
2 回答
245 浏览

r - 根据我现有的数据集生成额外的随机数据样本

我正在尝试从我现有的样本数据中生成更大的数据样本。例如irisN = 150我想将其重新调整为 4500(每个物种 1500)。此处的帖子中描述了一个示例https://seslezak.github.io/IrisData/。我不想resample或者bootstrap我有兴趣使用例如生成新值rnorm这是我到目前为止所尝试的。

在这里,我从样本分布中提取了值,但是我很难理解如何有效地构建整个“新”数据集?

0 投票
1 回答
1118 浏览

python - Iris dataset - 为特征排序/特征选择绘制 ROC 曲线并对其进行解释

我一直在参考一篇关于特征选择的文章,需要帮助来理解如何绘制 ROC 曲线。使用的数据集:鸢尾花

文章中提到的特征选择方法之一是:Visualways to rank features

下面的示例绘制了各种特征的 ROC 曲线。

我想了解这一点:

如何通过检查离散变量(特征)的值是否高于阈值来计算真实阳性率(TPR)和 FPR,阈值是通过将特征的范围(Max-Min)除以 100 个等距点来计算的?

这是生成的 ROC 曲线 在此处输入图像描述

0 投票
1 回答
1776 浏览

python - 如何加载 Tensorflow 数据集“Iris”并将标签更改为 one-hot 编码

我正在尝试直接从 tensorflow 数据集加载“iris”数据集,但我被卡住了。我习惯使用 CSV。

我不知道我应该如何分离特征 X,y。标签与特征处于不同的张量中,但我不知道如何访问它们以使用它们。我想对标签进行热编码并将它们输入模型,但我被困在这里。

tensorflow 文档很少包含有关如何执行此操作的信息。任何帮助深表感谢

0 投票
1 回答
732 浏览

tensorflow - 如何组合两个张量,使它们在一个数据集中?

我正在使用Titanic来自 TensorFlow API 的数据集。

我不知道如何使特征张量模型友好。

这是我得到的最好的,但一次只针对一个张量。我如何使它可以处理特征项中的所有张量?

如何连接agefare张量以使它们在一个数据集中?

我试过了concatstack但无济于事。

0 投票
0 回答
73 浏览

r - 在 iris 数据集中发现额外的列

所以我是 R 新手,刚刚开始练习。我的第一个命令是library(datasets)

然后我在做head(iris) 但是,我得到的是virginica而不是setosa。

在此处输入图像描述

当我这样做时,我会plot(iris)得到这个带有 64 个盒子的情节。然而,其他人通常只得到 25 盒

有 64 个盒子的地块

然后我做

我收到以下错误:

谁能解释为什么我会得到这些不寻常的结果?

0 投票
1 回答
231 浏览

r - 在(著名的)鸢尾花数据集上应用图聚类算法

我的问题涉及图聚类算法的应用。大多数时候,我看到图表是通过使用数据中的节点和边来制作的。例如,假设我们有社交媒体数据:数据中的每个个体都可以表示为一个节点,而个体之间的关系可以表示为边。使用这些信息,我们可以构建一个图,然后在该图上执行图聚类算法(例如 Louvain Clustering)。

有时,也可以使用点之间的距离来制作图表。点之间的距离可以被认为是边缘。例如,在 Spectral Clustering 算法中,根据数据制作 KNN(k 最近邻)图,然后在该图上执行 K-Means 聚类算法。

我的问题是:假设我们采用著名的鸢尾花数据并删除响应变量(“物种”)。创建这个鸢尾花数据的图表是否有意义,其中每个节点对应于一朵花,边对应于每个点之间的成对欧几里得距离?假设这是一种合乎逻辑且正确的方法,那么是否可以在此 Iris 图上执行图聚类算法?

下面,我尝试首先使用成对的欧几里德距离(在 R 中)创建 Iris 数据图。然后我在结果图上执行了 Louvain Clustering 和 Infomap Clustering。之后,我尝试创建 Iris 数据的 KNN 图并在此 KNN 图上执行 MST(最小生成树)聚类,以及执行 Louvain 聚类。

有人可以就我所做的事情发表意见吗?这是否直观,是否具有数学意义?作为一种“作弊”的方式——鸢尾花数据只有3种。因此,如果给定的聚类算法返回的聚类明显多于 3 个,我们就知道图和/或聚类算法可能不是最佳选择。但是,在实际应用中,我们无法知道数据中存在多少“真实”类。

0 投票
1 回答
89 浏览

r - 使用 MVN 包时如何修复错误“缺少参数“modelName”,没有默认值”

我正在使用MVNR 中的包来查找数据集的每个类是否iris是多元正态的。我在当天早些时候使用了下面的代码并从中生成了结果。但是,我去重新访问它,现在不断收到以下错误消息:

无法弄清楚这意味着什么以及如何解决它!

代码:

0 投票
1 回答
273 浏览

r - 如何在R中找到相关矩阵的p值?

我已经能够使用以下相关矩阵生成:

但是,努力获取该矩阵的 p 值。我需要矩阵形式的 p 值。这是我尝试过但没有任何运气的方法