0

我从单个图像中提取 2 个边缘特征(Hog 特征和 sobel 算子)。

如何在 Scikit-learn python 中创建图像特征数据集,如 iris_dataset ?在库中有代表数据集的 csv 文件。仅包含数字的 csv 文件。这些数字是如何产生的?特征提取?

不幸的是,我在这里只看到了一个 java 教程http://www.coccidia.icb.usp.br/coccimorph/tutorials/Tutorial-2-Creating- ...,在 5 点谈论生成训练矩阵(平均和共同方差矩阵)?Scikit 中有什么函数可以生成这些训练数组?

4

1 回答 1

2

您无需将数据包装为 CSV 文件即可将其加载为数据集。scikit-learn 模型有一个fit期望的方法:

  • 作为第一个参数,它是一个常规的 numpy 数组(或 scipy.sparse 矩阵),其形状(n_samples, n_features)(最常见的是dtype=numpy.float64)来编码训练集中每个样本的特征向量,

  • 对于有监督的分类模型,第二个参数带有形状(n_samples,)dtype=numpy.int32编码,用于对训练集的每个样本编码为整数值的类标签分配。

如果您不了解基本的 numpy 数据结构以及什么shapedtype含义,我强烈建议您查看SciPy Lecture Notes等教程。

编辑:如果您真的需要从 numpy 数组读取/写入数字 CSV,您可以使用numpy.loadtxt/numpy.savetxt

于 2012-12-11T14:49:48.640 回答