-1

我已经生成了许多像下面这样的车牌图像[![在此处输入图像描述]现在,想要转换所有像图像这样的real world vehicle number plate图像。例如- 在此处输入图像描述 如何将这些类型augmentation的所有增强图像保存在另一个文件夹中。

4

1 回答 1

2

解决方案

查看图书馆:albumentations. 试着回答这个问题:“你拥有的形象和你想要的形象有什么区别?” . 例如,该图像是:

  • 更像素化,
  • 粒状,
  • 分辨率较低,
  • 也可以有钉子/紧固螺钉
  • 可能在主号码下方或上方写有其他内容
  • 可能有阴影
  • 车牌可能在某些地方不均匀地亮,等等。

Albumentations,帮助你想出许多类型的图像增强。请尝试像我建议的那样分解这个问题,然后尝试从allementations中找出您需要哪些augmentations。

使用图像增强的示例albumentations

以下代码块 ( source ) 向您展示了如何为图像增强应用标注。如果你有一个图像和一个蒙版,它们都会经历相同的转换。

另一个来自 kaggle 的例子:Image Augmentation Demo with albumentation

from albumentations import (
    HorizontalFlip, IAAPerspective, ShiftScaleRotate, CLAHE, RandomRotate90,
    Transpose, ShiftScaleRotate, Blur, OpticalDistortion, GridDistortion, HueSaturationValue,
    IAAAdditiveGaussianNoise, GaussNoise, MotionBlur, MedianBlur, IAAPiecewiseAffine,
    IAASharpen, IAAEmboss, RandomBrightnessContrast, Flip, OneOf, Compose
)
import numpy as np

def strong_aug(p=0.5):
    return Compose([
        RandomRotate90(),
        Flip(),
        Transpose(),
        OneOf([
            IAAAdditiveGaussianNoise(),
            GaussNoise(),
        ], p=0.2),
        OneOf([
            MotionBlur(p=0.2),
            MedianBlur(blur_limit=3, p=0.1),
            Blur(blur_limit=3, p=0.1),
        ], p=0.2),
        ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.2, rotate_limit=45, p=0.2),
        OneOf([
            OpticalDistortion(p=0.3),
            GridDistortion(p=0.1),
            IAAPiecewiseAffine(p=0.3),
        ], p=0.2),
        OneOf([
            CLAHE(clip_limit=2),
            IAASharpen(),
            IAAEmboss(),
            RandomBrightnessContrast(),
        ], p=0.3),
        HueSaturationValue(p=0.3),
    ], p=p)

image = np.ones((300, 300, 3), dtype=np.uint8)
mask = np.ones((300, 300), dtype=np.uint8)
whatever_data = "my name"
augmentation = strong_aug(p=0.9)
data = {"image": image, "mask": mask, "whatever_data": whatever_data, "additional": "hello"}
augmented = augmentation(**data)
image, mask, whatever_data, additional = augmented["image"], augmented["mask"], augmented["whatever_data"], augmented["additional"]

战略

  • 首先将增强的数量减少到最低限度
  • 保存单个增强图像
  • 在增强后保存一些图像。
  • 现在测试和更新您的增强管道以满足您模拟真实场景的要求。
  • 最终确定您的管道并在大量图像上运行它。
  • 计时:多少张图像需要多长时间。
  • 然后最后在所有图像上运行它:这次你可以估计运行它需要多长时间。

注意:每次图像通过增强管道时,只有一个增强图像实例从中出来。因此,假设您想要每个图像的 10 个不同的增强版本,您需要将每个图像通过增强管道 10 次,然后再继续处理下一个图像。

# this will not be what you end up using
# but you can begin to understand what 
# you need to do with it.

def simple_aug(p-0,5):
    return return Compose([
        RandomRotate90(),
        # Flip(),
        # Transpose(),
        OneOf([
            IAAAdditiveGaussianNoise(),
            GaussNoise(),
        ], p=0.2),
    ])

# for a single image: check first
image = ... # write your code to read in your image here
augmentation = strong_aug(p=0.5)

augmented = augmentation({'image': image}) # see albumentations docs
# SAVE the image
# If you are using imageio or PIL, saving an image 
# is rather straight forward, and I will let you
# figure that out.
# save the content of the variable: augmented['image']

对于多个图像

假设每个图像通过10增强管道的时间,您的代码可能如下所示:

import os

# I assume you have a way of loading your 
# images from the filesystem, and they come 
# out of `images` (an iterator)

NUM_AUG_REPEAT = 10
AUG_SAVE_DIR = 'data/augmented'

# create directory of not present already
if not os.path.isdir(AUG_SAVE_DIR):
    os.makedirs(AUG_SAVE_DIR)

# This will create augmentation ids for the same image
# example: '00', '01', '02', ..., '08', '09' for
#          - NUM_AUG_REPEAT = 10
aug_id = lambda x: str(x).zfill(len(str(NUM_AUG_REPEAT)))

for image in images:
    for i in range(NUM_AUG_REPEAT):
        data = {'image': image}
        augmented = augmentation(**data)
        # I assume you have a function: save_image(image_path, image)
        # You need to write this function with 
        # whatever logic necessary. (Hint: use imageio or PIL.Image)
        image_filename = f'image_name_{aug_id(i)}.png'
        save_image(os.path.join(AUG_SAVE_DIR, image_filename), augmented['image'])
于 2021-07-09T22:06:07.977 回答