问题标签 [image-preprocessing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
871 浏览

keras - keras 中的 preprocess_input 大大增加了火车的大小

在使用 resnet50 模型进行训练之前,我使用以下方法预处理了我的输入:

并保存一个 numpy 图像数组。我发现没有preprocess_input,数组的大小是1.5G,有preprocess_input,大小是7G。这是正常行为吗?还是我错过了什么?为什么Zero-center by mean pixel大幅增加输入大小?

这就是zero center by mean pixel在 keras 中定义的方式

x = x[..., ::-1] x[..., 0] -= 103.939 x[..., 1] -= 116.779 x[..., 2] -= 123.68

0 投票
1 回答
2070 浏览

tensorflow - 将通道最后转换为通道第一图像

我有以下尺寸的图像张量

我希望这个张量在通道第一维中

我努力了

但它不起作用它与以前一样返回。

由于这是 Facenet 算法的要求,请提出方法。

0 投票
0 回答
25 浏览

java - 适当调整图像大小

我使用 android 相机捕获图像并保存为位图。

问题是位图很小,我想要更大的东西。只是我的代码的结果是存在一些像素化区域或结果与原始图像不匹配的直觉。

0 投票
1 回答
546 浏览

python - 卷积神经网络中的图像预处理在 Keras 与 Tflearn 中的精度较低

我正在尝试将此 tflearn DCNN 示例(使用图像预处理和增强)转换为 keras:

Tflearn 示例:

这在 50 个 epoch 后产生了以下结果:

然后我尝试使用相同的 DCNN 层、参数和图像预处理/增强将其转换为 Keras:

这产生了更差的验证准确性结果:

谁能帮我理解为什么?我是否在 Keras 中误用/误解了图像预处理/增强功能?

0 投票
1 回答
36 浏览

machine-learning - 机器学习 - 训练数据与“必须分类”数据

我有一个关于机器学习数据预处理的一般性问题。我知道将数据集中在 0 附近(均值减法),标准化数据(消除方差)几乎是必须做的。还有其他可能的技术。这必须用于训练数据和验证数据集。

我遇到了以下问题。我的神经网络经过训练可以对图像中的特定形状进行分类,如果我不将这种预处理技术应用于必须分类的图像,它就无法做到这一点。这种“分类”图像当然不包含在训练集或验证集中。因此我的问题是:

对必须分类的数据应用归一化是否正常,或者如果没有这种技术,我的网络性能不佳是否意味着我的模型在某种意义上是糟糕的,它无法泛化和过度拟合?

PS 在“分类”图像上使用了归一化,我的模型表现得非常好(大约 90% 的准确率),不低于 30%。

附加信息:模型:带有 keras 和 tensorflow 的卷积神经网络。

0 投票
1 回答
1178 浏览

python - 了解 ImageDataGenerator 中的参数和 Keras 中的流程

问题 1

rotation_range: Int. Degree range for random rotations指范围 [0, rotation_range] 还是 [-rotation_range, rotation_range]。如果我设置rotation_range=40,我的图像会在 [-40, 40] 或 [0, 40] 之间随机旋转吗?

问题2

是否ImageDataStore.flow在每个时期随机生成输入图像的不同增强,或者是在开始时生成并用于所有时期的单个增强。

例如,假设我有一些图像A,它是我对该方法的输入的一部分flow。图像A是否在训练前仅增强一次,并且此增强版本用于所有 epoch?还是图像A 在每个时期都随机增加?

问题 3

当参数在方法shuffle中设置为时,这是否意味着批次在每个时期都被打乱,或者批次中的图像在每个时期都被打乱?Trueflow

例如,假设我们的训练数据由 15 张图像(标记为 I 1 - I 15)组成,在 epoch 1 开始之前分为 3 个批次/小批次(标记为 B 1、B 2、B 3)。

假设在 epoch 1 之前,图像被分配到批次如下:

  • B 1 = {我1 , 我2 , 我3 , 我4 , 我5 }
  • B 2 = {我6 , 我7 , 我8 , 我9 , 我10 }
  • B 3 = {我11 , 我12 , 我13 , 我14 , 我15 }

现在在 epoch 1 中,批次按 B 1、 B 2、 B 3的顺序进行训练。

当 epoch 2 开始时,B 1、 B 2、 B 3中的图像是否会被打乱,以便每批不会包含相同的 5 张图像集?

0 投票
1 回答
4530 浏览

python - OCR 的图像预处理 - Tessaract

这是我要检测的图像

显然,这张图片非常难看,因为它的清晰度很低,而且不是一个真实的词。但是,使用此代码,我没有发现任何问题:

输出

这里有什么想法吗?我的对比函数产生的图像是:

在此处输入图像描述

哪个看起来不错?我没有大量的 OCR 经验。你会在这里推荐什么预处理?我尝试将图像的大小调整得更大,这有一点帮助,但还不够,还有一堆来自 PIL 的不同过滤器。虽然没有什么特别接近

0 投票
1 回答
1142 浏览

keras - 训练和预测时的 Keras 功能智能中心

我已经使用 featurewise_center=True,featurewise_std_normalization=True 实现了 ImageDataGenerator。我将生成器安装到我的训练集(它会学习一些统计数据)并训练我的模型。一切都很好。

训练完成并关闭 python 后,如何使用生成器对测试集进行相同的预处理?我想继承从 fit 中学到的统计数据,以便在我想测试或进一步训练我的模型时使用(原始训练集可能不再可用)。

提前致谢

0 投票
0 回答
43 浏览

python - 卷积预处理消耗更多 RAM Python

我正在尝试实现这个用于股票奖品预测的 CNN 模型:https
://github.com/ZezhouLi/Convolutional-Networks-for-Stock-Predicting 但是我在为实现进行数据预处理时遇到了这个问题。预处理步骤会消耗大量 RAM。(我的系统有 32 GB RAM 和 256 GB SSD 硬盘)
这是消耗 RAM 的文件,最后给出Memory Error

我有Memory Error,当程序消耗系统的所有 RAM 内存时会发生这种情况。请改进程序。

0 投票
0 回答
116 浏览

c# - 使用 C# 进行图像处理以进行货币检测

在 c# 中使用图像处理进行货币检测是否有任何参考?例如,我会将纸币的图片提供给代码并检测货币?