问题标签 [image-preprocessing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
22796 浏览

python - 如何实施 ZCA 美白?Python

我试图实现ZCA 美白并找到了一些文章来做,但它们有点令人困惑.. 有人可以为我发光吗?

任何提示或帮助表示赞赏!

这是我读过的文章:

http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf http://bbabenko.tumblr.com/post/86756017649/learning-low-level-vision-feautres-in-10-lines-of

我尝试了几件事,但其中大多数我不明白,我在某个步骤被锁定了。现在我有这个作为重新开始的基础:

0 投票
3 回答
9428 浏览

python - 这是在python中美白图像的正确方法吗?

我正在尝试zero-centerwhiten CIFAR10数据集,但我得到的结果看起来像随机噪声!
Cifar10数据集包含60,000大小为 的彩色图像32x32。训练集包含图像50,000,测试集包含10,000图像。
以下代码片段显示了我为使数据集变白所做的过程:

输出:

并尝试显示生成的图像:

在此处输入图像描述

顺便说一句,但是data_train[0].shape如果(3,32,32)我根据我得到的重塑白化图像

这可能只是一个可视化问题吗?如果是这样,我怎样才能确保是这样?

更新:
感谢@AndrasDeak,我以这种方式修复了可视化代码,但输出看起来仍然是随机的:

在此处输入图像描述

更新 2:
这是我在运行下面给出的一些命令时得到的:如下所示,toimage 可以很好地显示图像,但试图重塑它会弄乱图像。 在此处输入图像描述

在此处输入图像描述

由于某种奇怪的原因,这是我一开始得到的,但经过几次尝试,它变成了以前的图像。 在此处输入图像描述

0 投票
1 回答
956 浏览

neural-network - 我必须使用神经网络预处理测试数据吗?

我正在使用 Keras(2.0.0 版),我想使用预训练模型,例如 VGG16。为了开始,我运行了 [Keras 文档站点][ https://keras.io/applications/]的示例,用于使用 VGG16 提取特征:

使用的preprocess_input()函数让我感到困扰(该函数通过查看源代码可以看到平均像素以零为中心)。

在使用经过训练的模型之前,我真的需要预处理输入数据(验证/测试数据)吗?

a) 如果是,可以得出结论,您必须始终了解在训练阶段执行了哪些预处理步骤?!

b) 如果不是:验证/测试数据的预处理是否会导致偏差?

我感谢您的帮助。

0 投票
1 回答
238 浏览

python-3.x - 更改数据表示“LabelBinarizer”后尺寸不匹配

l 有66类字符。l 训练了一个多层感知器,向它输入图像,每个图像的类别是一个字符

Aa..Zz 0-9 ,;:! è à ~

l 应用 aLabelBinarizer将每个字符转换为 66 个类的向量(例如[0 0 0 0 ....1 ...... 0]),因为模型不接受非数字数据。我很惊讶地得到y_test(错误的)和y_train(正确的 66)的维度 61。我的代码有什么问题?

**

**

x_test

y_train

y_test

当 l 应用LabelBinazerl 得到y_test维度(732,61)而不是(732,66) 66 时,表示类的数量:

(1708, 66)

(732, 61) #为什么我得到的是 61 而不是 66

按照建议进行更改后

编辑2:

我收到以下错误:

EDIT3: 我的 jupyter 代码:

0 投票
1 回答
2700 浏览

ocr - 为什么 DPI 与相机为 OCR 拍摄的图像相关

我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目的过程中,我访问了很多网站,这些网站声称 Tesseract 在至少 300 DPI(每英寸点数)的图像上效果最好。

我的问题是为什么 DPI 被多次提到图像。我了解,当您扫描对象时,您希望以至少 300 DPI 进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知,DPI 是打印机的属性。基于此属性,它越高,图像越小,但质量越高。

现在,如果 DPI 与这些图像无关,那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时程序的结果会有所不同。是否有我不知道的 Tesseract 预处理?

0 投票
0 回答
2334 浏览

generator - 如何确定 Keras 中增强图像的数量?

我正在使用 Keras 2.0.0,我想在 GPU 上训练一个具有大量参数的深度模型。由于我的数据很大,我必须使用ImageDataGenerator. 老实说,我想ImageDataGenerator在这个意义上滥用,我不想执行任何增强。我只想将我的训练图像成批(并重新调整它们),这样我就可以将它们提供给model.fit_generator.

我从这里修改了代码,并根据我的数据做了一些小的改动(即将二进制分类改为分类。但这对于应该在这里讨论的这个问题无关紧要)。我有 15000 张火车图像,我想要执行的唯一“增强”是将范围 [0,1] 重新缩放到train_datagen = ImageDataGenerator(rescale=1./255). 创建我的 'train_generator' 后:

我通过使用来拟合模型model.fit_generator()

我将时期的数量设置为:epochs = 1 并将 batch_size 设置为:batch_size = 60

我希望在存储我的增强(即调整大小)图像的目录中看到:每个时期 15.000 个重新缩放的图像,即只有一个时期:15.000 个重新缩放的图像。但是,神秘的是,有 15.250 张图像。

有这么多图像的原因吗?我是否有权控制增强图像的数量?

类似的问题:

模型 fit_generator 未按预期提取数据样本(分别在 stackoverflow:Keras - How are batches and epochs used in fit_generator()?

为 ImageNet 等大型数据集使用数据生成器的具体示例

我感谢您的帮助。

0 投票
0 回答
379 浏览

image - 图像预处理以提高 OCR 的准确性

我在 OpenCV 中使用高斯核进行图像增强,具有 250% 的放大率:

但仍然没有给出很好的结果。我应该做哪些其他预处理来提高准确性?我正在使用ocr.space作为工具。

一些例子:

图片1 英语语言:

  • 它错误地将 KIHC US检测为KI-IC US

图片2 英语语言:

  • 它错误地将HRL US检测为HRI-US (倒数第二行)

图3 英语语言:

  • 它没有检测到BN FP

图4 英语语言:

  • 它错误地将HPQ US检测为I-IPQ US(但在下一行的 HEN3 GR 中正确检测到 H)
  • 它错误地将 LALAB MM检测为I-ALAB MM
  • 它没有检测到RB/LN
0 投票
1 回答
1074 浏览

c++ - 将图像magick命令转换为magick++ c++代码

我正在我的大学从事图像预处理项目,并使用图像魔法脚本来清理图像背景。现在我想通过 Magick++(用于 imageMagick 的 c++ api)获得相同的输出。

ImageMagick 命令:“转换-尊重括号(INPUT_IMAGE.jpg -colorspace gray -contrast-stretch 0)(-clone 0 -colorspace gray -negate -lat 25x25+30% -contrast-stretch 0)-compose copy_opacity -composite -fill白色 - 不透明 无 -alpha 关闭 - 背景 白色 OUTPUT_IMAGE.jpg"

我试图将此代码转换为 Magick++ 代码,但在“-lat”、“-contrast-stretch”和“-compose”位置失败。

到目前为止,这是我的 C++ 代码:

如果有人有想法或更好的解决方案,请告诉我。提前谢谢。

0 投票
1 回答
1212 浏览

python - Tensorflow:tf.image.central_crop 的问题

我面临以下问题tf.image.central_crop()

哪个输出

central_crop()函数似乎丢失了有关图像张量的高度宽度的信息。为什么会这样?

0 投票
1 回答
334 浏览

tensorflow - 将我自己的图像数据转换为 TFRecords

现在我正在练习将自己的图像数据转换为 tensorflow 的 TFRrcords。我对 tensorflow 非常陌生,所以我只是修改了从 Github 获得的 build_image_data.py。

这是原始代码的一些部分:

我将它们替换为:

但我收到如下错误:

有人可以帮助我,拜托。

谢谢。