1

我有一张纸的照片,我拿着我的网络摄像头,并希望将照片的区域最小化为仅纸。这样,我的 OCR 程序可能会更准确,也可能更快。

到目前为止,我已经采取了几个步骤将论文与背景隔离开来。

首先,我使用 Canny Edge 检测,设置了高阈值。这为我的图像边缘提供了两种颜色的表示。在它上面,我可以看到背景中碰巧有锐利边缘的其他一些伪影中的圆角矩形。

接下来,我使用 Hough 变换,在黑色背景上以极坐标绘制超过 100 个点的矢量。生成的图像如图所示:

在图像最长边缘上绘制的线条

看到中间那个大的(最大的)几乎是矩形的图形了吗?这就是我拿着的纸。我需要将该梯形隔离为多边形,或者以其他方式获取其顶点的坐标。

我可以在原始图像上使用这些坐标来隔离纸张的 PNG,仅此而已。

如果您能回答这三个子问题中的任何一个,我也将不胜感激。

- 你如何找到图像上这些线的交叉点的位置?

- 我将如何摆脱任何不形成中心梯形多边形的线?

- 有了这些点,有什么比凸包更好的东西可以让我只得到图像的梯形/矩形区域?

这是另一个示例,其中我的程序生成了更好的图像:

在此处输入图像描述

4

0 回答 0