1

我想在 Keras 中使用 ImageDataGenerator 来增强两个不同目录(文件夹:良性/恶性)中的图像。

然后我想将每个类的增强图像保存在一个单独的文件夹中。

我的目录结构如下:

dataset
|   
|-- original_images
|   |                        
|   |-- benign                  
|   |    |-- benign_image1.png
|   |    |-- benign_image2.png
|   |    |-- ...
|   |
|   |-- malignant                   
|        |-- malignant_image1.png
|        |-- malignant_image2.png
|        |-- ...  
|   
|-- augmented_images
    |                        
    |-- augmented_benign                <-- Here i want to save augmented images of benign folder   
    |    |-- augmented_img1.png
    |    |-- augmented_img2.png
    |    |-- ...
    |
    |-- augmented_malignant             <-- Here i want to save augmented images of malignant folder
         |-- augmented_img1.png
         |-- augmented_img2.png
         |-- ...  

我的问题是我无法区分这两个类的增强图像,因为它们都将存储在同一个文件夹中。

实际上,我只能将单个文件夹路径设置为“save_to_dir”参数,以便在那里存储图像。

因此,正如我提到的,所有增强的图像都将保存在一个文件夹中 ( augmented_images)。

你们能告诉我如何将每个班级的增强图像保存在单独的文件夹(augmented_benignaugmented_malignant)中吗?

我写的代码是这样的:

from keras.preprocessing.image import ImageDataGenerator

img_dir_path = "D:/dataset/original_images"
save_dir_path = "D:/dataset/augmented_images"

datagen = ImageDataGenerator(rotation_range=90)

data_generator = datagen.flow_from_directory(
    img_dir_path, 
    target_size=(128, 128), 
    color_mode="rgb", 
    batch_size=20, 
    save_to_dir="save_dir_path", 
    class_mode="binary", 
    save_prefix="augmented", 
    save_format="png")

for i in range(10):
    data_generator.next()
4

1 回答 1

0

下面的代码应该给你你想要的。我对它进行了测试,它完成了这项工作。我注意到的一件事是,当您设置 rotation_range=90 时,图像似乎在 -90 度到 + 90 度之间随机旋转。这有点意外。

sdir=r'c:\temp\dataset'
aug_dir=os.path.join(sdir,'augmented_images')
if os.path.isdir(aug_dir): # see if aug_dir exists if so remove it to get a clean slate
    shutil.rmtree(aug_dir)
os.mkdir(aug_dir) # make a new empty aug_dir
filepaths=[]
labels=[]
# iterate through original_images and create a dataframe of the form filepaths, labels
original_images_dir=os.path.join(sdir, 'original_images')
for klass in ['benign', 'malignant']:
    os.mkdir(os.path.join(aug_dir,klass)) # make the class subdirectories in the aug_dir
    classpath=os.path.join(original_images_dir, klass) # get the path to the classes (benign and maligant)
    flist=os.listdir(classpath)# for each class the the list of files in the class    
    for f in flist:        
        fpath=os.path.join(classpath, f) # get the path to the file
        filepaths.append(fpath)
        labels.append(klass)
    Fseries=pd.Series(filepaths, name='filepaths')
    Lseries=pd.Series(labels, name='labels')
df=pd.concat([Fseries, Lseries], axis=1) # create the dataframe
gen=ImageDataGenerator( rotation_range=90)
groups=df.groupby('labels') # group by class
for label in df['labels'].unique():  # for every class               
    group=groups.get_group(label)  # a dataframe holding only rows with the specified label 
    sample_count=len(group)   # determine how many samples there are in this class  
    aug_img_count=0
    target_dir=os.path.join(aug_dir, label)  # define where to write the images    
    aug_gen=gen.flow_from_dataframe( group,  x_col='filepaths', y_col=None, target_size=(128,128), class_mode=None,
                                        batch_size=1, shuffle=False, save_to_dir=target_dir, save_prefix='aug-',
                                        save_format='jpg')
    while aug_img_count<len(group):
        images=next(aug_gen)            
        aug_img_count += len(images) 
于 2021-07-24T05:09:38.007 回答