您好我有一个与基于内容的图像检索相关的项目。我对这个项目应该采用什么标准有疑问。当我在那里搜索时,我得到了两种方法特征提取和图像分割和区域操作。哪种方法更有效?
问问题
641 次
1 回答
4
两者都不。回答这个问题需要您进行一些研究。图像识别通常通过以下步骤完成
- 一些预处理以过滤掉不必要的特征(取决于上下文,对于文本识别,您将二值化图像,对于面部识别,可能会将它们设为灰度...)
- 寻找感兴趣的区域(在文本识别的情况下,您将尝试定位文本行/字形,在面部的情况下应用一些 haar 级联来查找面部所在的位置 - 也取决于您的图像集)
- 特征提取(有很多不同的方法,对于某些形状,像 Hu 这样的不变矩是很好的解决方案,对于面部,您可以使用 Zernike 矩获得更好的结果 - 它们基于极坐标)
- 匹配(更简单的部分:你有一些特征向量,通常是双倍的,现在你必须将它与其他特征向量/向量类匹配 - 这里你使用聚类分析,还有不同的技术)
您可能会在 JavaOCR 项目(Android 的文本识别)中看到这一切 - 但请从源代码编译它,因为版本已经很旧了):
于 2012-05-04T07:39:09.513 回答