问题标签 [cbir]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image - 从共现矩阵中提取纹理特征
我正在尝试在 MATLAB 中为彩色图像创建基于内容的图像检索系统 (CBIR),并使用 k-means 算法来提取数据库中图像的特征向量。每个图像有四个簇,每个簇都有关于颜色(R,G,B)和位置(X,Y)的信息。
我现在正在尝试向我的集群添加纹理特征,并且需要为此使用灰度共现矩阵 (GLCM)。我知道 GLCM 只是某个灰度级出现在另一个旁边的概率的指标,并且已经为我的图像创建了 GLCM。
我不清楚如何将 GLCM 映射到原始图像(以及它的簇),因为 GLCM 谈论像素对,我希望每个 X、Y 位置都有纹理信息。如何将 GLCM 转换为像素?
image - 在数据库的特定目录中查找重复或相似的图像
我对此很陌生,我的反对意见是构建一些 Web 应用程序来实现用户将图像存储在数据库中作为存储,如果有一对或一些图像存储两次或更多,我想要减少.
所以,我所需要的只是如何找到已经存储在数据库中的重复或相似图像,或者当用户尝试在第一步导入它时更好,并且他们的图像是否与已经存储在数据库中的图像相似数据库,系统可以警告不要存储该图像。
我只是想开发如何在数据库的特定目录上找到一些相似或重复的图像。你能从一开始就给我一些关于如何构建它的解释,以及我应该从基本步骤中学习什么来完成这个,比如教程或其他东西。如果可能的话,我想学很多东西。
在此先感谢,我真的需要这个帮助,谢谢。
database - 用于在数据库中查找相似图像的指标
有很多不同的算法可以计算两幅图像之间的相似度,但我找不到任何关于如何将这些信息存储在数据库中以便快速找到相似图像的信息。
“相似”是指经过旋转(90 度增量)、颜色调整和/或重新保存(有损 jpeg 压缩)的精确副本。
我试图想出图像的“指纹”,以便我可以快速查找它们。
到目前为止,我想出的最好的方法是生成灰度直方图。使用 16 个 bin 和 256 种灰度,我可以轻松创建一个 16 字节的指纹。这工作得相当好,但它并不像我想要的那么强大。
我尝试的另一个解决方案是调整图像大小,旋转它们以使它们都以相同的方式定向,对它们进行灰度化,标准化直方图,然后将它们缩小到大约 8x8,并将颜色减少到 16 种灰度。尽管微缩图像非常相似,但它们通常相差一两个像素,这意味着精确匹配无法正常工作。
如果没有精确匹配,我认为没有任何有效的方法可以对相似的照片进行分组(无需将每张照片与其他每张照片进行比较,即 O(n^2))。
那么,(1)如何创建我创建一个与上述要求不变的指纹/签名?或者,(2)如果这不可能,我可以使用什么其他指标,以便给定单个图像,我可以在数千个数据库中找到它的最佳匹配?
computer-vision - 具有 SIFT 类似特征的 CBIR,离散方法与连续方法
目前我正在处理实现一个用于对象识别的 CBIR 系统(详细的对象分类),现在因为我有一些工作的特征检测器和描述符,我试图找到处理这些特征的最佳方法,以完成基于内容的任务图像检索。
据我所知,这项任务有两个主要趋势,离散方法和连续方法。离散代表方法,如视觉词袋和码本,用于建立反向索引以应用引用文本检索的方法,而连续代表方法,如使用 kd 树和最近邻分类的 Best Bin First 搜索。
所以这两种方法之间的一个主要区别是,一种使用视觉词等特征的额外表示,另一种使用从描述符计算的 nD 特征。
我现在的问题是,这两种 CBIR 方法之间是否有任何比较可以帮助我找到适合我的任务的最佳方法?
c++ - 如何在 C\C++ 中重新调整 .bmp 文件的大小?
我正在做一个 CBIR 系统作为作业。有 100 个 .bmp 文件,但它们有不同的大小,如何将它们重新调整为相同的大小?谢谢。
matlab - Matlab - 将训练(神经网络)图像特征插入 ms 访问数据库
我正在使用 DWT 和神经网络做一个关于 CBIR 的项目。我已经提取了颜色和纹理特征并训练了提取特征的归一化值。我在matlab中使用了神经网络工具来实现图像分类。所有这些都成功地完成了。
我的问题是 - 有没有办法将训练后的图像值自动插入到 ms 访问数据库中?
谢谢。
machine-learning - 任何人都可以为 CBIR 推荐好的算法吗?
项目:基于内容的图像检索 - 半监督(训练时对图像进行手动标记)
描述
我在数据库中有 1000000 张图像。培训是手动(监督) - 为每个图像提供标题和标签。示例:coke.jpg 标题:可乐 标签:可乐、罐头
使用图像和标签,我必须训练系统。训练后,当我给出一个新图像(已经在数据库中/全新的)时,系统应该输出图像可能属于的可能标签,并显示属于每个标签的少量图像。系统也可能说未找到匹配项。
问题:
1) 图像指纹是什么意思?预期的图像指纹大小是多少?(很重要,因为数据库中将插入数百万张图像)
2)数据库中指纹的字段格式是什么?(很重要,因为需要快速搜索……脚本应该在不到 1 秒的时间内在 1M 图像数据库中搜索)
3)我们用来分析它们的描述符(算法)是什么?
提前致谢
image-processing - CBIR索引策略
我正在开发一个集成在车牌识别应用程序中的 CBIR 解决方案。图像匹配算法非常健壮,但正如您可以想象的那样,数据库很大,从数据库中提取图像进行匹配非常慢。我试图用小的局部特征向量甚至单个数值来量化图像,但没有成功。这个想法是索引一些这样的值,以允许真正快速提取,同时大大减少匹配候选者的数量。我已经阅读了很多关于该主题的论文,但其中大多数都将分类和机器学习作为解决方案。由于我没有看到分类如何有用,因为所有图像都非常相似(车牌图片),我想与“ s 过去也有类似的问题,甚至有人对我如何解决这个问题有一些线索。很长一段时间以来,我一直在尝试设计出解决此性能问题的方法,但没有太多成功。
java - 计算图像代码的算法
我正在分布式环境中开发基于内容的图像检索系统,我需要一种算法,该算法将图像作为输入并为我提供图像代码,该代码应该可以用于匹配视觉上相似的图像.
sift - 带有 SIFT 或 Harris-Laplace 描述符的开源 CBIR?
有谁知道使用 SIFT 或 Harris-Laplace 描述符的开源 CBIR?