问题标签 [image-generation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
9548 浏览

python - 图像生成器中的错误:要求检索元素 0,但序列的长度为 0

  • 我正在尝试计算二进制类彩色图像分类问题中的真阳性、真阴性、假阳性、假阴性比率

  • 我有二进制类、面部和背景彩色图像,我必须使用 MLP 对它们进行分类。

我的问题是:我收到错误:

ValueError:要求检索元素 0,但序列的长度为 0

编辑:完整回溯

  • 在尝试分别从 2 个类预测每个文件夹时(而不是包含 2 个文件夹的根文件夹,每个类一个用于训练)

我产生错误的代码是:

0 投票
1 回答
290 浏览

image-processing - 如何平均这两个图像,将它们作为输入提供给网络并输出在平均输入中使用的两个单独的图像?

给定来自 CIFAR10 的一对图像,平均这两个图像,将它们作为输入提供给网络,并输出用于平均输入的两个单独的图像。

我目前正在使用条件 GAN 和自动编码器来完成这项任务。但到目前为止还没有达到预期的结果,模型正在训练中,但我想知道这是否是解决这个任务的正确方向......

这是我到现在为止的输出......

在此处输入图像描述

0 投票
0 回答
68 浏览

deep-learning - 使用 DCGAN 生成 28x28 图像

我有一个预定义 nz=10, ngf= 64 的 python 测试代码

现在我需要重置隐藏层和其他参数才能输出大小为 28x28 的图像,即 -torch.Size([batch_size, 1, 28, 28])

请有人建议我应该在以下代码中进行哪些更改,以便能够生成 28x28 而不是 64x64 目前的图像

0 投票
1 回答
356 浏览

image-processing - 我有一个 GAN 输出,我可以将以下输出序列中的图像保存为单个图像吗?

例如,考虑这个图像,我想将每个部分保存为单个图像:

例如,考虑这个图像,我想将每个部分保存为单个图像

这是代码,这将在每个时期后给出一系列输出,我想将每个小输出保存为单个图像。我该如何进行?

0 投票
1 回答
61 浏览

tensorflow - ImageDataGenerator 目录

我正在使用 Tensorflow 中的 te ImageDataGenerator 来标记图像。

我似乎做错了什么试图指向我的培训目录,有什么想法吗?

提前致谢

0 投票
0 回答
908 浏览

python - VQGAN+CLIP风格控制

我正在使用 VQGAN+CLIP。是否有任何受控方式来影响通过文本提示创建的图像的样式?

例如,在 Twitter 和 Reddit 上有关于在提示中添加关键词的讨论,例如“虚幻引擎技巧”(https://twitter.com/arankomatsuzaki/status/1399471244760649729),其中您将“虚幻引擎”添加到末尾您的提示,例如“空气天使。虚幻引擎”。参数列表中是否有任何变量可以传递给可以执行此操作的 GAN,或者是否有办法将其包含在提示中但将其从一般解析的文本中排除,例如是否包含在 {} 或其他内容中?

0 投票
0 回答
12 浏览

image-generation - 无法从图像生成器获取图像计数

我正在尝试使用图像生成器训练模型,但它在 5 个类中给了我 0 个图像虽然子文件夹中有图像,但图像是 .dcm 格式

下面是我的代码

将我们的数据增强参数添加到 ImageDataGenerator

train_datagen = ImageDataGenerator(rescale = 1./255.,rotation_range = 40, width_shift_range = 0.2, height_shift_range = 0.2,shear_range = 0.2, zoom_range = 0.2, Horizo​​ntal_flip = True)

train_generator = train_datagen.flow_from_directory(TRAIN_PATH, batch_size = 20, class_mode = 'binary', target_size = (224, 224))

结果我找到了属于 5 个类的 0 个图像。

0 投票
0 回答
43 浏览

python - 神经网络未训练 - 图像复制 - 所有输出都相同

更新:使用 0.075 的学习率,随机权重和随机偏差,误差总是达到 0.17277051191827117,然后不动。在 0.01 的学习率下,同样的情况也会发生,我得到的只是黑色图像。似乎错误要高得多,这应该很难弄清楚

...无论我将学习率设置为多少,它总是落在同一件事上

我一直在尝试建立网络,工作。它应该拍摄一张图像,将其分解为 rgb 输入,然后将它们传递并重新创建该图像。我想我终于明白了必须设置阵列的方式,但现在数学不起作用。它总是在某一点停止训练或来回走动。我使用了几种学习率。我尝试过使用更多隐藏层,但我没有内存。我确信有更好的方法。我想转移到像 Keras 这样的东西上,但我想通过动画层更好地理解事物是如何工作的,但事物只是没有训练。

我用这个例子来构建我的 https://gist.github.com/jamesloyys/ff7a7bb1540384f709856f9cdcdee70d#file-neural_network_backprop-py

该示例有效,我能够为图层设置动画。但该示例是关于根据输入猜测 1 或 0。

这是我正在使用的代码。它生成的图像总是黑色、白色或灰色。我正在使用 128x128 的小图像或类似大小的图像。任何更大的都会给我带来记忆错误。我已经对这段代码进行了一些改进,运行了几次,然后它会出错,因为形状没有对齐。我遇到了很多转置问题 (.T) 我也经常遇到 .exp 问题,因为小数会突然失控,而且无论我运行多久,这个例子都没有。我有一个 16 核处理器,可以相当快地处理大小合适的图像,并且可以使用 numba 来加快速度,尽管我遇到了大量错误。

请在数学和算法方面提供任何帮助,绝对有帮助,我会很感激

0 投票
1 回答
19 浏览

computer-vision - 以下哪些 CNN 模型用于哪个计算机视觉任务?

我的分类正确吗?

LeNet-5:图像分类,
AlexNet:图像分类,
VGG-16:图像分类,
ResNet:图像分类,
Inception模块:图像分类,
MobileNet:图像分类,
EfficientNet:图像分类,
Neural Style Transfer:图像生成,
Sliding Windows Detection算法:物体检测,
R-CNN:物体检测,
YOLO:物体检测,
连体网络:图像识别,
U-Net:语义分割

如果错了,请纠正我。谢谢!

0 投票
1 回答
30 浏览

autoencoder - 使用自动编码器与变分自动编码器生成图像

当我们使用卷积自编码器生成新图像时,模型是否每次运行模型都会生成相同的图像?还是更愿意生成随机变化的图像?我认为每次我们运行模型时,自动编码器 (AE) 都会生成相同的新图像,因为它将输入图像映射到潜在空间中的单个点。另一方面,变分自动编码器 (VAE) 将输入图像映射到一个分布。因此,如果我们需要一些随机变化的图像,我们需要使用 VAE,如果我们每次运行模型都需要相同的生成图像,我们使用 AE。这是真的?我的问题是:AE 会生成随机变化的图像吗?