0

我有一个项目,我必须从图像中检测孟加拉语数字。我决定做一个实验,比如带空格和不带空格的数字。我的 python 程序可以从带有空格的图像中检测到所有数字。

当我给出没有空格的图像时出现问题。它不能像上一个那样顺利地减少数字。

这是我的代码

import cv2

image = cv2.imread("number.png")
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) 
_,thresh = cv2.threshold(gray,70,255,cv2.THRESH_BINARY_INV) 
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS,(3,3))
dilated = cv2.dilate(thresh,kernel,iterations = 0) 
_,contours, hierarchy = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE) 

i=5
for contour in contours:

    [x,y,w,h] = cv2.boundingRect(contour)

    cv2.imwrite(str(i)+".jpg",image[y:y+h,x:x+h])
    i=i+1

起初我使用扩张来寻找轮廓,但它不适用于没有空间图像的数字。然后我直接使用 thresh 输出,之后我得到了大部分数字,但我无法完美地切割它们,因为轮廓区域检测数字与其他数字的某些部分。虽然它在第二张图像中没有空间,但仍然有 2 个数字没有相互接触。那么为什么会有这样的输出呢?

带空间:

有空间

没有空格:

没有空间

4

1 回答 1

0

不幸的是,我没有注意到当我剪切矩形部分时,我添加了 x:x+h 而不是 x:x+w。这是主要问题。修改后,程序运行良好。对不起。

于 2016-10-14T03:15:49.933 回答