问题标签 [data-augmentation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
670 浏览

python - 用 numpy 计算坐标的新位置

我有一个用于关键点检测的图像数据集。每个图像都用一个关键点 (x|y) 标记。

我使用 numpy 翻转图像以进行数据增强。

我使用以下代码翻转图像水平:

与此代码垂直

到目前为止,一切都很好。但我还必须重新计算关键点(标签)([85 35])我知道它的基本数学,但我还没有找到解决方案。

提前致谢。

0 投票
1 回答
1008 浏览

python - 使用具有多个预处理功能的 keras ImageDataGenerator

假设我想用 Keras 训练一个图像数据库,并且我想使用 Keras ImageDataGenerator 自动生成新图像,问题是某些功能在经典设置(翻转、移位等)中不可用。

是否可以不仅添加一个功能列表,还添加一个功能列表作为“预处理功能”?

我也尝试在调用 datagen 之前应用我的函数,但是我有太多函数,以至于我有 MemoryErrors

0 投票
1 回答
307 浏览

python - 张量流中的批量图像增强

我想做图像增强,例如,在张量流中旋转随机角度。在每批中,我想为每张图像旋转不同的随机角度。我可以通过使用随机生成的角度张量tf.contrib.image.rotate来做到这一点:image_batch

但是,如果我使用 构建批处理allow_smaller_final_batch=True,则batch_size是无用的,因为它image_batch没有固定的批处理大小。并且旋转会失败,因为弧度和image_batch的N维不一样。

我该如何解决?

0 投票
1 回答
1218 浏览

python - 如何用 word-net 的同义词替换单词?

我想通过用 wordnet 中的同义词替换单词来为情感分析任务进行数据增强,但替换是随机的

0 投票
1 回答
4425 浏览

python - Python Google Translate API 错误:如何翻译大量数据

我的问题

我想使用一种由反向翻译数据集组成的 NLP 数据增强方法。

基本上,我有一个大型数据集(SNLI),由 1 100 000 个英语句子组成。我需要做的是:将这些句子翻译成一种语言,并将其翻译回英文。

对于几种语言,我可能必须这样做。所以我有很多翻译要做。

我需要一个免费的解决方案。


到目前为止我做了什么

我尝试了几个 python 模块进行翻译,但由于最近谷歌翻译 API 的变化,大多数都不起作用。如果我们应用此解决方案, googletrans似乎可以工作。

但是,它不适用于大数据集。谷歌限制了 15K 个字符(如thisthisthis所指出的)。第一个链接显示了一个假设的解决方法。


我被封锁的地方

即使我应用了解决方法(每次迭代都初始化翻译器),它也不起作用,并且出现以下错误:

我尝试使用代理和其他 Google 翻译网址:

但这并没有改变任何东西。


笔记

我的问题可能来自我使用多线程的事实:100 个工作人员来翻译整个数据集。如果它们并行工作,可能它们一起使用超过 15k 个字符。

但我应该使用多线程。如果我不这样做,翻译整个数据集将需要数周时间......


我的问题

如何修复此错误以便翻译所有句子?

如果不可能,对于这么大的数据集,是否有任何免费的替代方法可以在 Python 中获得机器翻译(不是强制使用谷歌翻译)?

0 投票
1 回答
92 浏览

python - 自动制作合成图像用于 cnn 训练

我想训练一个 CNN 来使用 tensorflow 检测和分类任何类型的标志(主要是实验室和安全标记)。虽然我可以使用例如 Bing API 为分类训练集收集足够的训练数据,但我正在努力考虑一种解决方案,以便为对象检测训练集获取足够的图像。由于这些标记大多不公开,我想我可以将自然场景图像与标记本身的图像合成,以获得训练集。有没有办法自动做到这一点?我查看了 tensorflow 数据增强类,但它似乎只为更简单的数据增强任务提供功能。

0 投票
0 回答
24 浏览

tensorflow - 当与初始模型的失真输入一起使用时,“颜色排序”是什么意思

我一直在寻找输入图像的预处理技术。在查看了 inception 模型的实现后:https ://github.com/awslabs/deeplearning-benchmark/blob/master/tensorflow/inception/inception/image_processing.py#L164 ,我发现他们使用的color_ordering参数可以是 0 或 1。在这种情况下,颜色排序是什么意思?

0 投票
1 回答
6767 浏览

python - 如何在张量流中随机旋转不同角度的图像

我知道我可以使用tf.contrib.image.rotate. 但是假设我想以弧度 -0.3 到 0.3 之间的角度随机应用旋转,如下所示:

到目前为止,这将正常工作。但是当最后一次迭代中批量大小发生变化并且出现错误时,问题就出现了。那么如何修复此代码并使其在所有情况下都能正常工作呢?请注意,输入图像是使用tf.data.Datasetapi 提供的。

任何帮助深表感谢!!

0 投票
1 回答
1519 浏览

tensorflow - TensorFlow Object Detection API:指定多个 data_augmentation_options

我想知道像这样指定数据增强之间是否有任何区别:

或者像这样:

在对象检测管道文件中?

模型存储库中的所有样本都使用第一种格式,但也接受第二种格式。

0 投票
1 回答
2909 浏览

tensorflow - Tensorflow 对象检测 API 数据增强边界框

对于使用 model_main.py 通过 Tensorflow API 进行对象检测,当我random_horizontal_flip在我的 pipeline.configdata_augmentation_options中使用 ie 时train_config,我的边界框是否也会受到影响?这非常重要,否则这些选项将不适用。是同一个问题,但没有正确回答。