3

这是我在 Stack Overflow 上的第一篇文章,如果问题没有得到足够的定义,我很抱歉。

我目前正在从图像中提取表格数据,我需要一种仅在垂直方向上扩展文本的方法,以便获得清晰的列表示,用于进一步分割。

去除水平和垂直线并按位变换图像后,我处于这个阶段:

扩张和线提取后的当前状态

这个问题的理想目标是:

目标

有没有对我的情况有帮助的方法或算法?

4

2 回答 2

5

您可以cv2.dilate使用适当的结构元素进行调用。

import cv2

pre_img = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)
h, w = pre_img.shape

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, ksize=(1, 2 * h))

dilated = cv2.dilate(pre_img, kernel)

cv2.imshow('input', pre_img)
cv2.imshow('output', dilated)
cv2.waitKey(0)

输入 输入图像

输出 输出图像

为了更好地可视化正在发生的事情:

blended = (pre_img.astype(float) + dilated.astype(float)) / 2
cv2.imshow('blended', blended.astype(np.uint8))
cv2.waitKey(0)

混合 图像混合

于 2019-11-26T11:58:26.017 回答
2

看起来您不想要扩张,而是想要最大投影。对于每一列,检查是否设置了任何像素。为此使用numpy.any

result = np.any(image, axis=0)
于 2019-11-26T15:25:30.627 回答