2

我正在处理我想从中取出部分并制作一个新图像的图像。我可以使用 ImageMagick 或 OpenCV。这是一个示例图像:

在此处输入图像描述

从这张图片中,我想取出标题,两个带注释的文本(一个在圆圈中,一个在矩形中),以及底部的文本。

因此,最终图像将具有:图像标题、带注释的文本 1、带注释的文本,这是一些测试。图像的这些部分不必在新图像中以任何特定顺序排列。

问题

  • 我可以使用什么样的策略来做到这一点?
  • 霍夫或康尼会帮忙吗?
  • 我在想,由于我想要返回的图像部分都是文本,也许霍夫线可以检测到直线,然后我将图像的这些部分裁剪掉......
  • 我的主要目标是提取文本,以便将其发送到 OCR

我试图侵蚀图像并想出了这个:

在此处输入图像描述

我的策略

以下是我的策略,只保留部分图像具有白色背景和文本。但是,我不确定这是否适用于 OpenCV ......

图像中会有不同的 ROI

  • 图像顶部总会有白色背景,我们称之为空间标题。所以我裁剪了图像顶部的矩形部分并将其另存为单独的图像
  • 图像底部总会有白色背景,我们称之为主体。所以我裁剪了图像底部的矩形部分并将其另存为单独的图像
  • 图像顶部会有一些文本,我们称之为带注释的文本。这将是正方形或圆形。我可以使用此答案中提到的技术来裁剪图像的这些部分并将它们保存为单独的图像。
4

1 回答 1

0

如果您只处理外观相似的字体,并且您不是在寻找超级高效的字体,您可以简单地对字母表中的每个字母(26 上和 26 下)执行相关性。对峰值进行阈值化并将它们加在一起。然后,您可以在峰周围定义边界框。

于 2013-04-27T05:47:09.733 回答