9

如何在 scikit-learn 中使用我自己的数据集?Scikit Tutorial总是以加载他的数据集(数字数据集,花卉数据集......)为例

http://scikit-learn.org/stable/datasets/index.html 即:从 sklearn.datasets 导入 load_iris

我有我的图像,但我不知道如何创建新图像。

特别是,对于开始,我使用我找到的这个例子(我使用库 opencv):

img =cv2.imread('telamone.jpg')

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.SURF()
kp, descritors = surf.detect(imgg,None,useProvidedKeypoints = False)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

我想提取一组图像的特征,以一种对实现机器学习算法有用的方式!

4

1 回答 1

5

您首先需要明确定义您要实现的目标:“将特征提取到一组图像中,以一种对实现机器学习算法有用的方式!” 太模糊了,无法给你任何指导。

您是否尝试这样做:

  • 图片整体的图像分类(例如室内场景与室外场景)?

  • 在一组图片的子部分内进行对象识别(例如识别不同图片中同一对象的多个实例),可能使用具有各种大小窗口的扫描程序?

  • 对象检测和基于类的分类(例如,查找图片中所有出现的汽车或行人,以及这些类实例的每个出现的边界框)?

  • 全图语义解析,也就是像素的分割+每个段的类分类(建筑、道路、人、树)......

这些任务中的每一个都需要不同的管道(特征提取+机器学习模型组合)。

您可能应该从阅读有关该主题的书开始,例如:http ://szeliski.org/Book/

另外作为旁注,stackoverflow 可能不是提出此类开放式问题的最佳场所。

于 2012-11-29T15:49:38.060 回答