0

我有一个图像数据集,在将其提供给深度学习算法之前,我需要将其裁剪为相同的大小。所有图像都有不同大小的黑边,如下图所示。有关裁剪具有不同边距大小的图像的方法的任何建议。 在此处输入图像描述

在此处输入图像描述在此处输入图像描述

4

4 回答 4

1

首先,使用低强度阈值进行值处理(如果您的背景绝对是完全黑色的,您甚至可以在强度为 1 时进行阈值处理)以确定所有非边界组件。

接下来,使用Connected-component 标记来确定所有孤立的前景组件。您感兴趣的中央扫描图像应该总是产生最大的组件。裁剪出这个最大的组件以删除边框以及所有可能的非黑色伪影(标签、字母等)。您应该只剩下无边界扫描。

您可以在任何基本图像处理库中找到所需的所有算法。我个人建议研究OpenCV,它们还包括 phyton 绑定。

于 2018-10-25T07:59:01.860 回答
1

一种方法可能如下:

  • 从左上角开始用红色填充图像,并允许与那里的黑色像素有大约 5% 的差异。

在此处输入图像描述

  • 现在将所有不是红色的东西变成白色 - 因为这之后的下一步会寻找白色像素。

在此处输入图像描述

  • 现在使用findContours()(寻找白色物体)并选择最大的白色轮廓作为您的图像并裁剪到该轮廓。

您可以考虑通过考虑以下一些想法来使事情变得更加健壮:

  • 您可以先将图像的副本标准化为全黑到白的范围,以防您得到任何带有近黑色边框的图像。

  • 您可以检查多个或所有角像素实际上是黑色的,以防您获得没有边框的图像。

  • 如果您的裁剪图像看起来小于总图像区域的 70%,您也可以标记问题。

  • 您可以考虑将具有 9x9 方形结构元素的形态开口作为倒数第二步来整理之前的内容findContrours()

在此处输入图像描述

于 2018-10-25T10:54:54.370 回答
1

由于您的边框颜色是黑色(几乎是完美的黑色)并且在所有图像中都是相同的,因此我建议应用二进制阈值,使除黑色区域之外的所有内容都变为白色(255)。现在某些图像区域也可能会受到影响,但这不是问题。

现在在图像中找到轮廓,第二大轮廓将是您的区域。计算此轮廓的矩形边界框并裁剪原始图像中的相同区域。

于 2018-10-25T12:11:37.517 回答
0

这是此问题的解决方案代码:

import warnings
warnings.filterwarnings('always')
warnings.filterwarnings('ignore')
import cv2
import numpy as np
import os

path = "data/benign/"
img_resized_dir = "data/pre-processed/benign/"
dirs = os.listdir(path)

def thyroid_scale():
    for item in dirs:
    if os.path.isfile(path+item):
        img = cv2.imread(path+item)
        gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        ret,thresh = cv2.threshold(gray,0,255,0)
        im2, contours, hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

        areas = [cv2.contourArea(c) for c in contours]
        max_index = np.argmax(areas)
        cnt=contours[max_index]
        x,y,w,h = cv2.boundingRect(cnt)
        crop_img = img[y+35:y+h-5,x+25:x+w-10]
        resize_img = cv2.resize(crop_img, (300, 250), interpolation = cv2.INTER_CUBIC)
        cv2.imwrite(img_resized_dir+item, resize_img)

thyroid_scale()
于 2018-10-31T22:16:01.897 回答