项目:基于内容的图像检索 - 半监督(训练时对图像进行手动标记)
描述
我在数据库中有 1000000 张图像。培训是手动(监督) - 为每个图像提供标题和标签。示例:coke.jpg 标题:可乐 标签:可乐、罐头
使用图像和标签,我必须训练系统。训练后,当我给出一个新图像(已经在数据库中/全新的)时,系统应该输出图像可能属于的可能标签,并显示属于每个标签的少量图像。系统也可能说未找到匹配项。
问题:
1) 图像指纹是什么意思?预期的图像指纹大小是多少?(很重要,因为数据库中将插入数百万张图像)
2)数据库中指纹的字段格式是什么?(很重要,因为需要快速搜索……脚本应该在不到 1 秒的时间内在 1M 图像数据库中搜索)
3)我们用来分析它们的描述符(算法)是什么?
提前致谢