问题标签 [iris-dataset]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

82 问题

0 投票

1 回答

285 浏览

r - 非重叠山脊线图 R

大家好，我正在查看 R 中的一些山脊线图，更具体地说是在“ggridges 简介”一文中，我的目标是制作这个图但没有重叠：

通过阅读同一篇文章，可以添加重叠：

但由于某种原因，我收到了这个错误：

谢谢

2020-06-18T02:59:35.853

0 投票

1 回答

90 浏览

python - 使用逻辑回归预测鸢尾花种类

我有一个给定的代码，它根据花瓣长度和花瓣宽度告诉您来自 iris 数据集的 Iris 是否是 iris vireginica。但是我如何对一朵全新的花进行预测呢？

现在假设我有一朵新花，我测量：

萼片长度：4.8
萼片宽度：2.5
花瓣长度：5.3
花瓣宽度：2.4

当我尝试以下预测时，我收到一条错误消息： ValueError: X has 1 features per sample; 期待 2

所以我的问题是，我如何正确地在这里预测一朵新花以及它是什么种类？

python numpy scikit-learn logistic-regression iris-dataset

2020-06-20T08:54:59.043

0 投票

2 回答

245 浏览

r - 根据我现有的数据集生成额外的随机数据样本

我正在尝试从我现有的样本数据中生成更大的数据样本。例如iris，N = 150我想将其重新调整为 4500（每个物种 1500）。此处的帖子中描述了一个示例https://seslezak.github.io/IrisData/。我不想resample或者bootstrap我有兴趣使用例如生成新值rnorm这是我到目前为止所尝试的。

在这里，我从样本分布中提取了值，但是我很难理解如何有效地构建整个“新”数据集？

r simulation iris-dataset

2020-06-24T20:02:34.617

0 投票

1 回答

1118 浏览

python - Iris dataset - 为特征排序/特征选择绘制 ROC 曲线并对其进行解释

我一直在参考一篇关于特征选择的文章，需要帮助来理解如何绘制 ROC 曲线。使用的数据集：鸢尾花

文章中提到的特征选择方法之一是：Visualways to rank features

下面的示例绘制了各种特征的 ROC 曲线。

我想了解这一点：

如何通过检查离散变量（特征）的值是否高于阈值来计算真实阳性率（TPR）和 FPR，阈值是通过将特征的范围（Max-Min）除以 100 个等距点来计算的？

这是生成的 ROC 曲线

python feature-selection roc confusion-matrix iris-dataset

user9329768

2020-07-25T17:38:15.347

0 投票

1 回答

1776 浏览

python - 如何加载 Tensorflow 数据集“Iris”并将标签更改为 one-hot 编码

我正在尝试直接从 tensorflow 数据集加载“iris”数据集，但我被卡住了。我习惯使用 CSV。

我不知道我应该如何分离特征 X,y。标签与特征处于不同的张量中，但我不知道如何访问它们以使用它们。我想对标签进行热编码并将它们输入模型，但我被困在这里。

tensorflow 文档很少包含有关如何执行此操作的信息。任何帮助深表感谢

python tensorflow tensorflow2.0 tensorflow-datasets iris-dataset

2020-08-04T08:59:47.623

0 投票

1 回答

732 浏览

tensorflow - 如何组合两个张量，使它们在一个数据集中？

我正在使用Titanic来自 TensorFlow API 的数据集。

我不知道如何使特征张量模型友好。

这是我得到的最好的，但一次只针对一个张量。我如何使它可以处理特征项中的所有张量？

如何连接age和fare张量以使它们在一个数据集中？

我试过了concat，stack但无济于事。

tensorflow tensorflow2.0 tensorflow-datasets iris-dataset

2020-08-09T02:10:05.317

0 投票

0 回答

73 浏览

r - 在 iris 数据集中发现额外的列

所以我是 R 新手，刚刚开始练习。我的第一个命令是library(datasets)

然后我在做head(iris) 但是，我得到的是virginica而不是setosa。

在此处输入图像描述

当我这样做时，我会plot(iris)得到这个带有 64 个盒子的情节。然而，其他人通常只得到 25 盒

有 64 个盒子的地块

然后我做

我收到以下错误：

谁能解释为什么我会得到这些不寻常的结果？

r iris-dataset

2020-08-24T02:07:48.713

0 投票

1 回答

231 浏览

r - 在（著名的）鸢尾花数据集上应用图聚类算法

我的问题涉及图聚类算法的应用。大多数时候，我看到图表是通过使用数据中的节点和边来制作的。例如，假设我们有社交媒体数据：数据中的每个个体都可以表示为一个节点，而个体之间的关系可以表示为边。使用这些信息，我们可以构建一个图，然后在该图上执行图聚类算法（例如 Louvain Clustering）。

有时，也可以使用点之间的距离来制作图表。点之间的距离可以被认为是边缘。例如，在 Spectral Clustering 算法中，根据数据制作 KNN（k 最近邻）图，然后在该图上执行 K-Means 聚类算法。

我的问题是：假设我们采用著名的鸢尾花数据并删除响应变量（“物种”）。创建这个鸢尾花数据的图表是否有意义，其中每个节点对应于一朵花，边对应于每个点之间的成对欧几里得距离？假设这是一种合乎逻辑且正确的方法，那么是否可以在此 Iris 图上执行图聚类算法？

下面，我尝试首先使用成对的欧几里德距离（在 R 中）创建 Iris 数据图。然后我在结果图上执行了 Louvain Clustering 和 Infomap Clustering。之后，我尝试创建 Iris 数据的 KNN 图并在此 KNN 图上执行 MST（最小生成树）聚类，以及执行 Louvain 聚类。

有人可以就我所做的事情发表意见吗？这是否直观，是否具有数学意义？作为一种“作弊”的方式——鸢尾花数据只有3种。因此，如果给定的聚类算法返回的聚类明显多于 3 个，我们就知道图和/或聚类算法可能不是最佳选择。但是，在实际应用中，我们无法知道数据中存在多少“真实”类。

r graph cluster-analysis modularity iris-dataset

2020-08-25T04:51:02.557

0 投票

1 回答

89 浏览

r - 使用 MVN 包时如何修复错误“缺少参数“modelName”，没有默认值”

我正在使用MVNR 中的包来查找数据集的每个类是否iris是多元正态的。我在当天早些时候使用了下面的代码并从中生成了结果。但是，我去重新访问它，现在不断收到以下错误消息：

无法弄清楚这意味着什么以及如何解决它！

代码：

r maven multivariate-testing iris-dataset

2020-09-13T11:53:14.403

0 投票

1 回答

273 浏览

r - 如何在R中找到相关矩阵的p值？

我已经能够使用以下相关矩阵生成：

但是，努力获取该矩阵的 p 值。我需要矩阵形式的 p 值。这是我尝试过但没有任何运气的方法

r p-value pearson-correlation r-corrplot iris-dataset

2020-09-14T00:05:33.450

1 2 3 4 5 6 7 8 9 10

问题标签 [iris-dataset]

Reference