-2

我已经做了几个星期的图像处理和机器学习课程。每天我都会学到一些关于图像处理的新知识,以及如何训练系统识别图像中的模式。我的问题是,为了成功进行图像识别,必须遵循哪些步骤,例如去噪、使用 LDA、PCA,然后使用神经网络。我不是在寻找任何算法,只是对从捕获图像到测试输入图像的相似性的每个步骤(5 -6)的简要概述。

PS# 对于模组,在将这个问题标记为不具建设性之前,我知道它不具建设性,但我不知道该放在哪个网站上。所以请重定向我那个 stackexchange 的网站。

谢谢。

4

3 回答 3

3

我将如下描述管道,并省略了许多项目符号。

  1. 获取带有地面实况标签的图像。
    • 亚马逊 M-土耳其人
    • 来自 flickr 的图像和标签
  2. 该图像的计算特征
    • 直接将图像拉伸为列向量
    • 使用更复杂的特征,例如词袋、LBP。
  3. 如果需要,对特征进行后处理以减少噪声的影响
    • 稀疏编码
    • 最大池化
    • 美白
  4. 给定(特征,标签)对训练分类器/回归器
    • 支持向量机
    • 助推
    • 神经网络
    • 随机森林
    • 谱聚类
    • 启发式方法...
  5. 使用经过训练的模型来识别看不见的图像并使用一些指标评估结果。

顺便提一句。传统上,我们将使用 PCA 等降维方法来使问题易于处理,但最近的研究似乎对此并不关心。

于 2013-07-24T17:33:44.347 回答
2

几个月前,我使用本地二进制模式开发了一个人脸识别系统。在这种方法中,我首先从本地存储或相机中获取图像,然后使用本地二进制模式方法考虑输入图像的每个块。得到输入图像的 LBP 后,我找到了 lbp 特征直方图的卡方距离。使用相同的过程将其值与存储的数据库图像进行比较。我能够得到同样的脸。

于 2013-07-22T18:34:07.783 回答
1

amazon M-turk 是一项让人们为您工作的服务。(你付钱给他们)

SIFT 是兴趣点的描述符。通过比较这些描述符,您可以找到图像之间的对应关系。(SIFT 适合第 2 步。)

在执行第 4 步时,您可以选择组合不同分类器的结果,或者简单地信任一个分类器的结果。这取决于情况。

你要标注受影响区域的位置吗?我不确定你要做什么。

无法使用评论,所以我发布了另一个答案。

于 2013-07-27T03:00:59.473 回答