问题标签 [image-preprocessing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何实施 ZCA 美白?Python
我试图实现ZCA 美白并找到了一些文章来做,但它们有点令人困惑.. 有人可以为我发光吗?
任何提示或帮助表示赞赏!
这是我读过的文章:
http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf http://bbabenko.tumblr.com/post/86756017649/learning-low-level-vision-feautres-in-10-lines-of
我尝试了几件事,但其中大多数我不明白,我在某个步骤被锁定了。现在我有这个作为重新开始的基础:
python - 这是在python中美白图像的正确方法吗?
我正在尝试zero-center
和whiten
CIFAR10
数据集,但我得到的结果看起来像随机噪声!
Cifar10
数据集包含60,000
大小为 的彩色图像32x32
。训练集包含图像50,000
,测试集包含10,000
图像。
以下代码片段显示了我为使数据集变白所做的过程:
输出:
并尝试显示生成的图像:
顺便说一句,但是data_train[0].shape
如果(3,32,32)
我根据我得到的重塑白化图像
这可能只是一个可视化问题吗?如果是这样,我怎样才能确保是这样?
更新:
感谢@AndrasDeak,我以这种方式修复了可视化代码,但输出看起来仍然是随机的:
更新 2:
这是我在运行下面给出的一些命令时得到的:如下所示,toimage 可以很好地显示图像,但试图重塑它会弄乱图像。
neural-network - 我必须使用神经网络预处理测试数据吗?
我正在使用 Keras(2.0.0 版),我想使用预训练模型,例如 VGG16。为了开始,我运行了 [Keras 文档站点][ https://keras.io/applications/]的示例,用于使用 VGG16 提取特征:
使用的preprocess_input()
函数让我感到困扰(该函数通过查看源代码可以看到平均像素以零为中心)。
在使用经过训练的模型之前,我真的需要预处理输入数据(验证/测试数据)吗?
a) 如果是,可以得出结论,您必须始终了解在训练阶段执行了哪些预处理步骤?!
b) 如果不是:验证/测试数据的预处理是否会导致偏差?
我感谢您的帮助。
python-3.x - 更改数据表示“LabelBinarizer”后尺寸不匹配
l 有66类字符。l 训练了一个多层感知器,向它输入图像,每个图像的类别是一个字符
Aa..Zz 0-9 ,;:! è à ~
l 应用 aLabelBinarizer
将每个字符转换为 66 个类的向量(例如[0 0 0 0 ....1 ...... 0]
),因为模型不接受非数字数据。我很惊讶地得到y_test
(错误的)和y_train
(正确的 66)的维度 61。我的代码有什么问题?
**
**
x_test
y_train
y_test
当 l 应用LabelBinazer
l 得到y_test
维度(732,61)
而不是(732,66)
66 时,表示类的数量:
(1708, 66)
(732, 61) #为什么我得到的是 61 而不是 66
按照建议进行更改后
编辑2:
我收到以下错误:
EDIT3: 我的 jupyter 代码:
ocr - 为什么 DPI 与相机为 OCR 拍摄的图像相关
我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目的过程中,我访问了很多网站,这些网站声称 Tesseract 在至少 300 DPI(每英寸点数)的图像上效果最好。
我的问题是为什么 DPI 被多次提到图像。我了解,当您扫描对象时,您希望以至少 300 DPI 进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知,DPI 是打印机的属性。基于此属性,它越高,图像越小,但质量越高。
现在,如果 DPI 与这些图像无关,那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时程序的结果会有所不同。是否有我不知道的 Tesseract 预处理?
generator - 如何确定 Keras 中增强图像的数量?
我正在使用 Keras 2.0.0,我想在 GPU 上训练一个具有大量参数的深度模型。由于我的数据很大,我必须使用ImageDataGenerator
. 老实说,我想ImageDataGenerator
在这个意义上滥用,我不想执行任何增强。我只想将我的训练图像成批(并重新调整它们),这样我就可以将它们提供给model.fit_generator
.
我从这里修改了代码,并根据我的数据做了一些小的改动(即将二进制分类改为分类。但这对于应该在这里讨论的这个问题无关紧要)。我有 15000 张火车图像,我想要执行的唯一“增强”是将范围 [0,1] 重新缩放到train_datagen = ImageDataGenerator(rescale=1./255)
. 创建我的 'train_generator' 后:
我通过使用来拟合模型model.fit_generator()
。
我将时期的数量设置为:epochs = 1
并将 batch_size 设置为:batch_size = 60
我希望在存储我的增强(即调整大小)图像的目录中看到:每个时期 15.000 个重新缩放的图像,即只有一个时期:15.000 个重新缩放的图像。但是,神秘的是,有 15.250 张图像。
有这么多图像的原因吗?我是否有权控制增强图像的数量?
类似的问题:
模型 fit_generator 未按预期提取数据样本(分别在 stackoverflow:Keras - How are batches and epochs used in fit_generator()?)
我感谢您的帮助。
image - 图像预处理以提高 OCR 的准确性
我在 OpenCV 中使用高斯核进行图像增强,具有 250% 的放大率:
但仍然没有给出很好的结果。我应该做哪些其他预处理来提高准确性?我正在使用ocr.space作为工具。
一些例子:
- 它错误地将 KIHC US检测为KI-IC US
- 它错误地将HRL US检测为HRI-US (倒数第二行)
- 它没有检测到BN FP
- 它错误地将HPQ US检测为I-IPQ US(但在下一行的 HEN3 GR 中正确检测到 H)
- 它错误地将 LALAB MM检测为I-ALAB MM
- 它没有检测到RB/LN
c++ - 将图像magick命令转换为magick++ c++代码
我正在我的大学从事图像预处理项目,并使用图像魔法脚本来清理图像背景。现在我想通过 Magick++(用于 imageMagick 的 c++ api)获得相同的输出。
ImageMagick 命令:“转换-尊重括号(INPUT_IMAGE.jpg -colorspace gray -contrast-stretch 0)(-clone 0 -colorspace gray -negate -lat 25x25+30% -contrast-stretch 0)-compose copy_opacity -composite -fill白色 - 不透明 无 -alpha 关闭 - 背景 白色 OUTPUT_IMAGE.jpg"
我试图将此代码转换为 Magick++ 代码,但在“-lat”、“-contrast-stretch”和“-compose”位置失败。
到目前为止,这是我的 C++ 代码:
如果有人有想法或更好的解决方案,请告诉我。提前谢谢。
python - Tensorflow:tf.image.central_crop 的问题
我面临以下问题tf.image.central_crop()
哪个输出
该central_crop()
函数似乎丢失了有关图像张量的高度和宽度的信息。为什么会这样?
tensorflow - 将我自己的图像数据转换为 TFRecords
现在我正在练习将自己的图像数据转换为 tensorflow 的 TFRrcords。我对 tensorflow 非常陌生,所以我只是修改了从 Github 获得的 build_image_data.py。
这是原始代码的一些部分:
我将它们替换为:
但我收到如下错误:
有人可以帮助我,拜托。
谢谢。