我有一堆从 pdf 中提取的劣质照片。我认识的人在她的电脑 (Mac) 上某处有高质量的照片,但我的理解是很难找到它们。
我想
- 循环浏览每张质量差的照片
- 使用每张劣质照片作为查询图像并使用此人的计算机作为数据库执行反向图像搜索以搜索更高质量的图像
- 并在一个目标文件夹中创建每个高质量图像的副本。
示例伪代码
for each image in poorQualityImages:
search ./macComputer for a higherQualityImage of image
copy higherQualityImage to ./higherQualityImages
我需要执行一次此操作。我正在寻找一种工具、github 存储库或库,它们可以执行此功能,而不是深入了解基于内容的图像检索。
reddit上有一个帖子,有人试图做类似的事情
imgdupes是一个似乎几乎可以实现这一目标的程序,但我不想删除重复项,我想将最高质量的重复项复制到目标文件夹
更新
给我以前的图像处理教授发了电子邮件,他给我发了这个
在我的脑海中,没有什么是开箱即用的。
这里没有保证的解决方案,但您可以缩小搜索空间。您需要一个小程序来输出两个图像之间的 MSE 或 SSIM 相似性索引,然后编写另一个程序或 shell 脚本来扫描硬盘驱动器并计算硬盘驱动器上的每个图像与每个查询图像之间的 MSE,然后检查具有最高 X% 相似度分数的图像。
类似的东西。仍然不能保证找到你想要的一切。如果低质量图像的像素尺寸与高质量图像不同,则必须进行一些图像缩放以获得相似度指数。如果劣质图像具有不同的纵横比,那就更糟了。
所以我认为这并不难,但也不是微不足道的。难度部分取决于低质量图像中损坏的性质。
更新