问题标签 [data-augmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 用 numpy 计算坐标的新位置
我有一个用于关键点检测的图像数据集。每个图像都用一个关键点 (x|y) 标记。
我使用 numpy 翻转图像以进行数据增强。
我使用以下代码翻转图像水平:
与此代码垂直
到目前为止,一切都很好。但我还必须重新计算关键点(标签)([85 35]
)我知道它的基本数学,但我还没有找到解决方案。
提前致谢。
python - 使用具有多个预处理功能的 keras ImageDataGenerator
假设我想用 Keras 训练一个图像数据库,并且我想使用 Keras ImageDataGenerator 自动生成新图像,问题是某些功能在经典设置(翻转、移位等)中不可用。
是否可以不仅添加一个功能列表,还添加一个功能列表作为“预处理功能”?
我也尝试在调用 datagen 之前应用我的函数,但是我有太多函数,以至于我有 MemoryErrors
python - 张量流中的批量图像增强
我想做图像增强,例如,在张量流中旋转随机角度。在每批中,我想为每张图像旋转不同的随机角度。我可以通过使用随机生成的角度张量tf.contrib.image.rotate
来做到这一点:image_batch
但是,如果我使用 构建批处理allow_smaller_final_batch=True
,则batch_size
是无用的,因为它image_batch
没有固定的批处理大小。并且旋转会失败,因为弧度和image_batch的N维不一样。
我该如何解决?
python - 如何用 word-net 的同义词替换单词?
我想通过用 wordnet 中的同义词替换单词来为情感分析任务进行数据增强,但替换是随机的
python - Python Google Translate API 错误:如何翻译大量数据
我的问题
我想使用一种由反向翻译数据集组成的 NLP 数据增强方法。
基本上,我有一个大型数据集(SNLI),由 1 100 000 个英语句子组成。我需要做的是:将这些句子翻译成一种语言,并将其翻译回英文。
对于几种语言,我可能必须这样做。所以我有很多翻译要做。
我需要一个免费的解决方案。
到目前为止我做了什么
我尝试了几个 python 模块进行翻译,但由于最近谷歌翻译 API 的变化,大多数都不起作用。如果我们应用此解决方案, googletrans似乎可以工作。
但是,它不适用于大数据集。谷歌限制了 15K 个字符(如this、this和this所指出的)。第一个链接显示了一个假设的解决方法。
我被封锁的地方
即使我应用了解决方法(每次迭代都初始化翻译器),它也不起作用,并且出现以下错误:
我尝试使用代理和其他 Google 翻译网址:
但这并没有改变任何东西。
笔记
我的问题可能来自我使用多线程的事实:100 个工作人员来翻译整个数据集。如果它们并行工作,可能它们一起使用超过 15k 个字符。
但我应该使用多线程。如果我不这样做,翻译整个数据集将需要数周时间......
我的问题
如何修复此错误以便翻译所有句子?
如果不可能,对于这么大的数据集,是否有任何免费的替代方法可以在 Python 中获得机器翻译(不是强制使用谷歌翻译)?
python - 自动制作合成图像用于 cnn 训练
我想训练一个 CNN 来使用 tensorflow 检测和分类任何类型的标志(主要是实验室和安全标记)。虽然我可以使用例如 Bing API 为分类训练集收集足够的训练数据,但我正在努力考虑一种解决方案,以便为对象检测训练集获取足够的图像。由于这些标记大多不公开,我想我可以将自然场景图像与标记本身的图像合成,以获得训练集。有没有办法自动做到这一点?我查看了 tensorflow 数据增强类,但它似乎只为更简单的数据增强任务提供功能。
tensorflow - 当与初始模型的失真输入一起使用时,“颜色排序”是什么意思
我一直在寻找输入图像的预处理技术。在查看了 inception 模型的实现后:https ://github.com/awslabs/deeplearning-benchmark/blob/master/tensorflow/inception/inception/image_processing.py#L164 ,我发现他们使用的color_ordering
参数可以是 0 或 1。在这种情况下,颜色排序是什么意思?
python - 如何在张量流中随机旋转不同角度的图像
我知道我可以使用tf.contrib.image.rotate
. 但是假设我想以弧度 -0.3 到 0.3 之间的角度随机应用旋转,如下所示:
到目前为止,这将正常工作。但是当最后一次迭代中批量大小发生变化并且出现错误时,问题就出现了。那么如何修复此代码并使其在所有情况下都能正常工作呢?请注意,输入图像是使用tf.data.Dataset
api 提供的。
任何帮助深表感谢!!
tensorflow - TensorFlow Object Detection API:指定多个 data_augmentation_options
我想知道像这样指定数据增强之间是否有任何区别:
或者像这样:
在对象检测管道文件中?
模型存储库中的所有样本都使用第一种格式,但也接受第二种格式。
tensorflow - Tensorflow 对象检测 API 数据增强边界框
对于使用 model_main.py 通过 Tensorflow API 进行对象检测,当我random_horizontal_flip
在我的 pipeline.configdata_augmentation_options
中使用 ie 时train_config
,我的边界框是否也会受到影响?这非常重要,否则这些选项将不适用。这是同一个问题,但没有正确回答。