58

有谁知道最近关于图像标识识别的学术工作?请仅在您熟悉此特定主题的情况下回答(我可以自己在 Google 上搜索“标识识别”,非常感谢)。任何有计算机视觉知识并在物体识别方面做过工作的人也欢迎发表评论。

更新:请参考算法方面(您认为合适的方法,该领域的论文,它是否应该适用于现实世界的数据(并且已经过测试),效率考虑)而不是技术方面(使用的编程语言或无论是使用 OpenCV...)图像索引和基于内容的图像检索的工作也可以提供帮助。

4

4 回答 4

39

您可以尝试在此处使用 SIFT 等本地功能: http ://en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该可以工作,因为徽标形状通常是恒定的,因此提取的特征应该匹配得很好。

工作流程将是这样的:

  1. 检测角点(例如 Harris 角点检测器) - 对于 Nike 标志,它们是两个尖头。

  2. 计算描述符(如 SIFT - 128D 整数向量)

  3. 在训练阶段记住他们;在匹配阶段,为训练期间获得的数据库中的每个特征找到最近的邻居。最后,您有一组匹配项(其中一些可能是错误的)。

  4. 使用 RANSAC 找出错误的匹配项。因此,您将获得描述从理想徽标图像转换为您找到徽标的矩阵的矩阵。根据设置,您可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)。

Szeliski 的书中有一章(4.1)是关于局部特征的。 http://research.microsoft.com/en-us/um/people/szeliski/Book/

附言

  1. 我假设您想在照片中查找徽标,例如查找所有百事可乐广告牌,因此它们可能会被扭曲。如果您需要在屏幕上找到电视频道徽标(使其不会旋转和缩放),您可以更轻松(模式匹配或其他东西)。

  2. 传统的 SIFT 不考虑颜色信息。由于徽标通常具有恒定的颜色(尽管确切的颜色取决于闪电和相机),您可能需要以某种方式考虑颜色信息。

于 2010-01-19T09:36:16.230 回答
32

我们致力于现实世界图像中的徽标检测/识别。我们还创建了一个数据集FlickrLogos-32并将其公开,包括数据、基本事实和评估脚本。

在我们的工作中,我们将徽标识别视为检索问题,以简化多类识别并允许此类系统轻松扩展到许多(例如数千个)徽标类。

最近,我们开发了一种称为Bundle min-Hashing的捆绑技术,它将多个局部特征的空间配置聚合成高度独特的特征包。束表示可用于检索和识别。请参阅以下示例热图以进行徽标检测:

在此处输入图像描述 在此处输入图像描述

您将在论文[1] [2]中找到有关内部操作、该方法的潜在应用、性能实验以及相关工作的许多参考的更多详细信息。

于 2013-01-03T11:01:08.547 回答
7

工作内容:体育视频数据库中的商标匹配和检索获得论文的 PDF:http ://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

我们使用 SIFT 作为商标和图像描述符,并使用归一化阈值匹配来计算模型和图像之间的距离。在我们最新的工作中,我们已经能够使用元模型大大减少计算,创建评估存在于同一商标的不同版本中的 SIFT 点的相关性。

我想说的是,由于目前使用的电视标准的视觉质量非常差,因此处理视频通常比处理照片更难。

马可

于 2010-03-23T15:08:14.823 回答
4

我在一个项目中工作,我们必须做一些非常相似的事情。起初我尝试使用这个软件使用 Haar 训练技术

开放式CV

它有效,但不是满足我们需求的最佳解决方案。我们的源图像(我们正在寻找徽标的位置)是固定大小的,并且仅包含徽标。因此,我们能够将 cvMatchShapes 与已知的良好匹配一起使用,并比较返回的值以认为匹配良好。

于 2010-01-15T22:38:50.410 回答