问题标签 [image-augmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pytorch - 如何在 pythorch 中创建增强数据集
我必须将每个图像的对应图像添加到原始 CIFAR 数据集中,旋转 90 度。这个想法是创建一个 RotationDateset,一个扩展 datasets.VisionDataset 的类,它采用 CIFAR 并执行上述操作。
//org_dataset 是 CIFAR //num_rots 是 4 //transforms 是 transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5, 0.5,0.5), (0.5, 0.5, 0.5))])
这是我最初导入和转换 CIFAR 的方式:
这是我创建 CIFAR 增强的方法:
和模型训练
//问题是当我启动模型时,pythorch会抛出这个错误:
任何人都可以帮助我吗?提前致谢
pytorch - 增强如何增加图像数量
我对增强如何增加图像数量感到困惑。我可以计算吗?假设我批量有 10 张图片
在 pytorch 中进行增强后,我的模型将在一个批次中训练多少张图像。我知道最后数据大小保持不变,但我想知道它是否会在管道中的任何时候增加
python - Keras ImageDataGenerator 亮度范围
在Keras 的文档中,ImageDataGenerator
引用了一个名为brightness_range
(default None
) 的参数。文档说这个 arg 接受
元组或两个浮点数的列表。从中选择亮度偏移值的范围。
这是非常模棱两可的。这是否意味着范围内的浮点数(0,255)?或者它是否意味着范围(0,1)内的浮点数?缺乏特异性表明两者都可以工作,但我不知道这个工具是如何使用的。是否有任何进一步的文档或使用此 arg 的一般最佳实践?
python - Keras 混合功能模型中的图像增强
我在 中创建了一个混合模型Keras
,为元数据和图像数据创建权重,然后将它们组合起来进行分类。这是模型:
由于不平衡,我决定增加图像。我使用了以下 ImageDataGenerator:
然后我编译并尝试使用以下方法训练模型ImageDataGenerator().flow()
:
这给了我一个错误:
我已经尝试了多个版本的代码,但我只是对后端不够熟悉,无法正确诊断问题。谁能帮我这个?
型号代码和 MRE
型号代码
元训练 MRE
img_train MRE
数组太大,请参见此处的代码。
y_train.shape
python - 如何在 Python 中删除部分 PNG 图像以使其不透明
我有一个在 PNG 图像上创建遮挡的脚本。来自https://arxiv.org/pdf/2001.04086.pdf的数据增强遮挡技术。
该脚本运行良好,可以很好地创建遮挡,但它们在 PNG 上绘制为黑色矩形。
我希望他们做的是从 PNG 中剪下这些矩形,并使其成为 PNG 的 alpha 层的一部分,这样当粘贴到背景顶部时,背景会通过矩形显示。基本上使黑色矩形透明。
当前的实现输出如下所示:
下面的完整脚本,但需要在这里工作的区域:
已尝试添加 alpha 蒙版,但这会从背景中删除 alpha 通道并使矩形保持黑色。
完整的脚本(有人可能会喜欢):
python - 公式和数学等图像增强操作
我可以在 python 中实现 imgaug 或albumentations。但是,我想从理论上更多地了解变换操作,这是与数学相关的公式。特别是亮度增强、尺度增强和天气增强。
我找到了一个介绍我的问题的网站。(https://www.frontiersin.org/articles/10.3389/fncom.2019.00083/full)
您能否推荐或教授上述操作?
谢谢
python - 如何在增强后将掩码转换为分类以进行多类分割而不会导致内存死亡
我正在研究一个有 6 个类的多类语义分割问题。我在 keras ImageDataGenerator 中增强了图像和蒙版。现在我想将我的面具转换为分类。这样我就可以将其输入到 Unet。如果我在增加掩码后尝试转换为分类,内存就会消失。如果我尝试在增强之前对其进行转换,图像生成器会抛出一个错误,因为它只支持 4 个类。有没有替代方法?
pytorch - 在使用 pytorch 转换时得到这个--->TypeError: integer argument expected, got float
我克隆了迁移学习库repo 并致力于最大分类器差异。我正在尝试更改增强但收到以下错误
之前的代码是
我刚刚添加 T.RandomPerspective(distortion_scale = 0.8, p=0.5, fill=0.6)
了 val_transform。在此之前,我还为 train_transform 添加了一些其他转换,但仍然遇到相同的错误。可能是什么问题呢?