0

我正在修改此示例 https://github.com/Microsoft/CNTK/blob/master/Tutorials/CNTK_206B_DCGAN.ipynb以使用 png MNIST 文件(而不是教程使用的平面一维数组图像输入)。我使用 ImageDeserializer (和映射文件来加载数据):

def create_mb_source(map_file, image_dims, num_classes, randomize=True):
transforms = [
    xforms.scale(width=image_dims[2], height=image_dims[1], channels=image_dims[0], interpolations='linear')]
return MinibatchSource(ImageDeserializer(map_file, StreamDefs(
    features=StreamDef(field='image', transforms=transforms),
    labels=StreamDef(field='label', shape=num_classes))),
                       randomize=randomize)

我将输入输出更改为鉴别器以期望 28x28 图像(和生成器的输出)。在这里查看代码:https ://github.com/olgaliak/cntk-cyclegan/blob/master/trainDCGan.py

问题是 trainDCGan.py 现在正在产生噪音。感谢你的帮助!

4

1 回答 1

1

一旦我解决了这个问题 1) 在 ImageDeserializer 中切换到使用 3 个通道 2) 将网络架构更改为使用 2d strides\kernels 而不是 1d。 此提交突出显示了使事情正常进行的更改。

于 2017-05-18T05:49:37.323 回答