问题标签 [cbir]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
97 浏览

c++ - 基于学习内容的视频搜索的起点

我参与了几年的计算机视觉开发,但从未使用过 CBIR 或视频搜索。
你能告诉我如何开始吗?文章、算法、开源引擎 (C++)。
我想创建一个视频搜索引擎,它可以在数千个索引中找到视频剪辑,使用一个短的扭曲、缩放、旋转或剪切片段。

0 投票
1 回答
1981 浏览

image-processing - 为什么 SIFT 描述符是尺度不变的?

我的理解:SIFT 描述符使用从 16x16 邻域像素计算的方向梯度直方图。大图像中16x16的区域可以是很小的区域,例如猫爪上一根头发的1/10,当您将目标图像调整为小尺寸时,同一关键点周围的16x16邻域可以是很大一部分图像,例如猫的爪子 将原始图像与使用 SIFT 描述符调整大小的图像进行比较对我来说没有意义,谁能告诉我我的理解有什么问题?

0 投票
0 回答
4526 浏览

python - OpenCV 和基于内容的图像检索 - 有没有办法在不下载图像的情况下使用在线图像数据库

我正在尝试构建一个 CBIR 系统,最近使用 OpenCV 函数在 Python 中编写了一个程序,该程序让我可以查询本地图像数据库并返回结果(按照本教程进行操作)。我现在需要将它与另一个网络抓取模块(使用 Scrapy)链接起来,其中我输出了 ~1000 个在线图像链接。这些图像分散在整个网络中,应该输入到第一个 OpenCV 模块。是否可以在不下载的情况下对这个在线图像集进行计算?

这些是我为 OpenCV 模块所遵循的步骤

1) 定义基于区域的彩色图像描述符

2)从数据集中提取特征(索引)(作为命令行参数传递的数据集)

3) 定义相似度度量

`

4) 执行实际搜索

最后的命令行命令是:

其中 index.csv 是第 2 步之后在图像数据库上生成的文件。query.png 是我的查询图像,数据集是包含约 100 张图像的文件夹。

那么是否可以修改索引以使我不需要本地数据集并且可以直接从 URL 列表中进行查询和索引?

0 投票
1 回答
126 浏览

ocr - 使用 CBIR 和 OCR 进行图像比较

处理从给定图像中检索内容的项目,并与存储库中的其他图像进行比较并列出匹配的图像。

应该采取什么正确的方法来做到这一点,以便搜索最终不会减慢。

作为第一级过滤,我计划做的是使用任何图像查询(CBIR 技术)来检索与给定图像模式匹配的图像。然后进行 OCR 以获取图像内容并进行匹配检查。

请让我知道是否有更好的方法。

0 投票
0 回答
591 浏览

ios - 在后台线程上使用 CIDetector 和其他 Core Image API 时崩溃

为了进一步研究这个问题,我删除了关于这个主题的最后一个问题。

我正在开发一个基于内容的图像检索数据库,该数据库为 iPhone 上的本地相册编制索引。我编写了特征提取的过滤器和方法,但作为预处理步骤,我使用 CIDetector 检测面部矩形并通过局部二进制模式过滤器过滤这些矩形并提取小矩形的直方图。

该过程显然会花费大量时间来索引大型相册,因此我将其设计为异步的,并使用后台线程运行过滤器并提取特征。

这样做的问题是访问相册图像的唯一方法似乎是通过 PHAsset。有两个常用的 API,它们都需要回调块。其中一个检索 UIImage 表示,这不是我想要的,主要是因为我需要加载其中的许多并且内存限制很紧,我根本不打算显示图像。它还将返回一个对象字典,其中一个是图像文件本身的 URL,但 using+[CIImage imageWithContentsOfURL]将返回 nil,并且 iOS 控制台将显示在使用此 API 时对图像的权限被拒绝。

另一个是-[PHAsset requestContentEditingInputWithOptions]。这个特定的 API 将强制回调块在主队列中被调用,无论哪个队列调用 API,回调块总是被分派到主队列中。使用此 API,可以使用 成功加载 CIImage +[CIImage imageWithContentsOfURL],这意味着 API 已有效地授予访问文件的权限。然后,我可以将 CIImage 放在将执行所有索引处理步骤的不同队列中。

这种方法似乎有效,但只持续了很短的时间。最终应用程序崩溃了,我所看到的只是在之前的处理过程中出现了一条消息,上面写着Connection to assetsd was interrupted or assetsd died.

如果我不在另一个队列上排队操作,只是让它在 API 强制回调进入的主队列上运行,那么一切都很好,并且该消息不会显示在控制台中。但这让我的主线程一直忙于进行非常昂贵的图像处理。

编辑:我突然想到我可能误用了这个 API,但它似乎是唯一能以适当格式为我提供我想要的数据的东西(一个 CIImage,可用于从文件中加载像素数据)必要的,在处理过程中)。

我目前使用的 API 可能更适合交互式图像过滤会话,其中图像编辑数据与 UI 一起使用,并且管理它的服务保持与应用程序的会话打开。

0 投票
1 回答
761 浏览

matlab - Matlab中的3D HSV图像直方图,不同的编号。每个通道的 bin 数量?

我正在开发一个 CBIR 系统,其中我使用 HSV 直方图作为我的功能之一。对于每张图像,我想计算一个直方图,其中 n1 表示色调,n2 表示饱和度,n3 表示值。我想要一个向量,它是 n1xn2xn3 维的,具有这些箱的所有可能组合。例如:如果我分别为色调、饱和度和值取一个元组 (8, 12, 3) 箱,那么我想计算一个 8x12x3=288 维向量。在openCV中,我们有calcHist()这样做的功能,但我在matlab中找不到类似的功能。这是我所做的

但 y1 将是 23 维而不是所需的 288 维。请帮助我,如果有类似于calcHist()openCV 的功能,那么建议我这样做。

0 投票
0 回答
79 浏览

java - 如何使用 java 代码创建和链接图像数据库以进行 android 应用程序处理

我正在 CBIR 上制作一个 android 应用程序,即为我的最后一年项目进行反向图像搜索。我已经开始使用运行正常的 eclipse 在 java 中开发相同的算法。但它的搜索基于计算机文件夹中的图像。但是在我的情况下,最后我必须将我的 java 代码移植到 android。那么我如何才能从我的文件夹中获取图像以在 android 应用程序上进行处理。通过在谷歌上搜索,我想到了使用 Xampp 来实现相同的功能,但是 php 代码在一定程度上可以工作,但没有将图像存储在phpmyadmin 数据库。什么是最可行的方法,我被困在图像数据库部分。请帮助选择软件和方法。

0 投票
1 回答
916 浏览

opencv - 使用 SIFT/SURF 从一组图像中检索相似图像

我正在研究 SIFT 功能,并且正在使用视觉词袋方法首先制作词汇表,然后进行匹配。我发现了类似的问题,但没有找到合适的答案。在下面的链接中提出了同样的问题,但没有令人满意的答案,任何人都可以帮助我。提前谢谢你。

https://stackoverflow.com/questions/29366944/finding-top-similar-images-from-a-database-using-sift-surf

0 投票
1 回答
137 浏览

image-processing - 使用 CBIR(基于内容的图像检索)的任何想法应用程序或系统

对不起,我需要你的帮助。我很难在主题 CBIR 中找到独特的技术(应用程序、系统或工具)。您知道可以使用 CBIR 开发的独特应用吗?我瞎了眼,对CBIR一无所知。我的意思是,我有关于 CBIR 的搜索想法,但它太普通了,我的老师让我找到关于 CBIR 应用程序的更有吸引力的想法。搜索引擎图像,识别旅游对象的应用程序,我的想法,您还有其他想法吗?

NB:CBIR 基于内容的图像检索(CBIR),也称为按图像内容查询(QBIC)和基于内容的视觉信息检索(CBVIR),是计算机视觉技术应用于图像检索问题,即问题在大型数据库中搜索数字图像(有关 CBIR 领域的最新科学概述,请参阅本调查 [1])。基于内容的图像检索与传统的基于概念的方法相反(请参阅基于概念的图像索引)。“基于内容”意味着搜索分析图像的内容而不是元数据,例如关键字、标签或与图像相关联的描述。在此上下文中,术语“内容”可能指颜色、形状、纹理或可以从图像本身获得的任何其他信息。

0 投票
0 回答
69 浏览

matlab - CBIR 系统 - 检索前 20 个匹配图像的限制会产生相同的精度曲线、召回率和 f 测量值

我想知道这个限制是否是一个有效的选项?

因为我们不能独立判断精确召回,f-measure趋势。如果可以,那么如何证明所有精度、召回率和 f 测量曲线的相同趋势?

我使用了一个包含 500 张图像的数据集,每类 100 张图像。我为每个班级使用了一张随机图像来检查算法,其想法是检索前 20 个匹配图像(真阳性 + 假阳性)。我在哪里错过了重点?

注意:我正在使用 Matlab。

这是最终的图表:

全部在一张图中