php - 对非常相似的图像进行排序 PHP OCR

Question

感谢您查看我的问题。

基本上我要做的是在这里找到所有看起来像第一张和第三张图像的图像：http: //imgur.com/a/IhHEC

并删除所有看起来不像的（2,4）。

我尝试了几个库都无济于事。

另一种可接受的方法是检查图像是否包含“代码：”，因为该字符串在我必须整理的每个字符串中。

谢谢你，史蒂夫

编辑：虽然第一张和第三张图片看起来尺寸相同，但事实并非如此。

score 4 · Accepted Answer

如果这些是您要使用的实际图像，那么直方图相似性似乎可以完成这项工作。第一个和第三个反差很大，第二个和第四个，尤其是第四个，有很大的不同强度。

您可以轻松地制作图像中灰色阴影的直方图，然后将阈值应用于直方图的形状以对其进行分类。

编辑：要实际做到这一点：您可以遍历每个像素并创建一个像素值数组 => 找到的次数。由于它是灰度的，您可以选择 R、G 或 B 通道。然后将每个数字除以图像中的像素数以进行归一化，因此它适用于任何大小。然后，直方图中的每个条目将是所用像素数的一小部分。然后，您可以测量高于某个阈值的值的数量。如果有很多灰色，你会得到大量的小值。如果没有，您将获得少量大值。

score 0 · Accepted Answer

由于我在处理图像文本而不是图像对象方面的背景，我会在 OCR 后处理过程中执行此操作，方法是在文本内容中搜索“关键字”或检查代表所需数据的“正则表达式”。这意味着整个工作需要分成两个阶段：图像到文本 OCR（免费或便宜，软件或云）和实际分离过程（简单编程）。

php - 对非常相似的图像进行排序 PHP OCR

2 回答 2

Related

Reference