问题标签 [data-augmentation]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

381 问题

0 投票

3 回答

670 浏览

python - 用 numpy 计算坐标的新位置

我有一个用于关键点检测的图像数据集。每个图像都用一个关键点 (x|y) 标记。

我使用 numpy 翻转图像以进行数据增强。

我使用以下代码翻转图像水平：

与此代码垂直

到目前为止，一切都很好。但我还必须重新计算关键点（标签）（[85 35]）我知道它的基本数学，但我还没有找到解决方案。

提前致谢。

2018-09-03T08:18:11.430

0 投票

1 回答

1008 浏览

python - 使用具有多个预处理功能的 keras ImageDataGenerator

假设我想用 Keras 训练一个图像数据库，并且我想使用 Keras ImageDataGenerator 自动生成新图像，问题是某些功能在经典设置（翻转、移位等）中不可用。

是否可以不仅添加一个功能列表，还添加一个功能列表作为“预处理功能”？

我也尝试在调用 datagen 之前应用我的函数，但是我有太多函数，以至于我有 MemoryErrors

python keras deep-learning data-augmentation

2018-09-22T15:13:18.020

0 投票

1 回答

307 浏览

python - 张量流中的批量图像增强

我想做图像增强，例如，在张量流中旋转随机角度。在每批中，我想为每张图像旋转不同的随机角度。我可以通过使用随机生成的角度张量tf.contrib.image.rotate来做到这一点：image_batch

但是，如果我使用构建批处理allow_smaller_final_batch=True，则batch_size是无用的，因为它image_batch没有固定的批处理大小。并且旋转会失败，因为弧度和image_batch的N维不一样。

我该如何解决？

python tensorflow data-augmentation

2018-09-30T07:30:57.443

0 投票

1 回答

1218 浏览

python - 如何用 word-net 的同义词替换单词？

我想通过用 wordnet 中的同义词替换单词来为情感分析任务进行数据增强，但替换是随机的

python sentiment-analysis wordnet pos-tagger data-augmentation

2018-10-18T11:20:05.853

0 投票

1 回答

4425 浏览

python - Python Google Translate API 错误：如何翻译大量数据

我的问题

我想使用一种由反向翻译数据集组成的 NLP 数据增强方法。

基本上，我有一个大型数据集（SNLI），由 1 100 000 个英语句子组成。我需要做的是：将这些句子翻译成一种语言，并将其翻译回英文。

对于几种语言，我可能必须这样做。所以我有很多翻译要做。

我需要一个免费的解决方案。

到目前为止我做了什么

我尝试了几个 python 模块进行翻译，但由于最近谷歌翻译 API 的变化，大多数都不起作用。如果我们应用此解决方案， googletrans似乎可以工作。

但是，它不适用于大数据集。谷歌限制了 15K 个字符（如this、this和this所指出的）。第一个链接显示了一个假设的解决方法。

我被封锁的地方

即使我应用了解决方法（每次迭代都初始化翻译器），它也不起作用，并且出现以下错误：

我尝试使用代理和其他 Google 翻译网址：

但这并没有改变任何东西。

笔记

我的问题可能来自我使用多线程的事实：100 个工作人员来翻译整个数据集。如果它们并行工作，可能它们一起使用超过 15k 个字符。

但我应该使用多线程。如果我不这样做，翻译整个数据集将需要数周时间......

我的问题

如何修复此错误以便翻译所有句子？

如果不可能，对于这么大的数据集，是否有任何免费的替代方法可以在 Python 中获得机器翻译（不是强制使用谷歌翻译）？

python dataset translation google-translate data-augmentation

2018-10-31T01:59:37.783

0 投票

1 回答

92 浏览

python - 自动制作合成图像用于 cnn 训练

我想训练一个 CNN 来使用 tensorflow 检测和分类任何类型的标志（主要是实验室和安全标记）。虽然我可以使用例如 Bing API 为分类训练集收集足够的训练数据，但我正在努力考虑一种解决方案，以便为对象检测训练集获取足够的图像。由于这些标记大多不公开，我想我可以将自然场景图像与标记本身的图像合成，以获得训练集。有没有办法自动做到这一点？我查看了 tensorflow 数据增强类，但它似乎只为更简单的数据增强任务提供功能。

python tensorflow dataset conv-neural-network data-augmentation

2018-11-07T20:33:05.477

0 投票

0 回答

24 浏览

tensorflow - 当与初始模型的失真输入一起使用时，“颜色排序”是什么意思

我一直在寻找输入图像的预处理技术。在查看了 inception 模型的实现后：https ://github.com/awslabs/deeplearning-benchmark/blob/master/tensorflow/inception/inception/image_processing.py#L164 ，我发现他们使用的color_ordering参数可以是 0 或 1。在这种情况下，颜色排序是什么意思？

tensorflow image-preprocessing data-augmentation

2018-11-11T15:01:53.493

0 投票

1 回答

6767 浏览

python - 如何在张量流中随机旋转不同角度的图像

我知道我可以使用tf.contrib.image.rotate. 但是假设我想以弧度 -0.3 到 0.3 之间的角度随机应用旋转，如下所示：

到目前为止，这将正常工作。但是当最后一次迭代中批量大小发生变化并且出现错误时，问题就出现了。那么如何修复此代码并使其在所有情况下都能正常工作呢？请注意，输入图像是使用tf.data.Datasetapi 提供的。

任何帮助深表感谢！！

python tensorflow image-rotation data-augmentation

2018-11-13T03:11:27.873

0 投票

1 回答

1519 浏览

tensorflow - TensorFlow Object Detection API：指定多个 data_augmentation_options

我想知道像这样指定数据增强之间是否有任何区别：

或者像这样：

在对象检测管道文件中？

模型存储库中的所有样本都使用第一种格式，但也接受第二种格式。

tensorflow object-detection data-augmentation

2018-11-19T21:51:24.920

0 投票

1 回答

2909 浏览

tensorflow - Tensorflow 对象检测 API 数据增强边界框

对于使用 model_main.py 通过 Tensorflow API 进行对象检测，当我random_horizontal_flip在我的 pipeline.configdata_augmentation_options中使用 ie 时train_config，我的边界框是否也会受到影响？这非常重要，否则这些选项将不适用。这是同一个问题，但没有正确回答。

tensorflow object-detection bounding-box data-augmentation

2018-11-20T09:31:29.713

1 2 3 4 5 6 7 8 9 10

问题标签 [data-augmentation]

我的问题

到目前为止我做了什么

我被封锁的地方

笔记

我的问题

Reference