0 投票

5 回答

22796 浏览

python - 如何实施 ZCA 美白？Python

我试图实现ZCA 美白并找到了一些文章来做，但它们有点令人困惑.. 有人可以为我发光吗？

任何提示或帮助表示赞赏！

这是我读过的文章：

http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf http://bbabenko.tumblr.com/post/86756017649/learning-low-level-vision-feautres-in-10-lines-of

我尝试了几件事，但其中大多数我不明白，我在某个步骤被锁定了。现在我有这个作为重新开始的基础：

user2136049

2015-07-21T01:14:02.840

0 投票

3 回答

9428 浏览

python - 这是在python中美白图像的正确方法吗？

我正在尝试zero-center和whiten CIFAR10数据集，但我得到的结果看起来像随机噪声！
Cifar10数据集包含60,000大小为的彩色图像32x32。训练集包含图像50,000，测试集包含10,000图像。
以下代码片段显示了我为使数据集变白所做的过程：

输出：

并尝试显示生成的图像：

顺便说一句，但是data_train[0].shape如果(3,32,32)我根据我得到的重塑白化图像

这可能只是一个可视化问题吗？如果是这样，我怎样才能确保是这样？

更新：
感谢@AndrasDeak，我以这种方式修复了可视化代码，但输出看起来仍然是随机的：

更新 2：
这是我在运行下面给出的一些命令时得到的：如下所示，toimage 可以很好地显示图像，但试图重塑它会弄乱图像。

由于某种奇怪的原因，这是我一开始得到的，但经过几次尝试，它变成了以前的图像。

python image-preprocessing image-whitening

2017-01-13T13:28:33.060

0 投票

1 回答

956 浏览

neural-network - 我必须使用神经网络预处理测试数据吗？

我正在使用 Keras（2.0.0 版），我想使用预训练模型，例如 VGG16。为了开始，我运行了 [Keras 文档站点][ https://keras.io/applications/]的示例，用于使用 VGG16 提取特征：

使用的preprocess_input()函数让我感到困扰（该函数通过查看源代码可以看到平均像素以零为中心）。

在使用经过训练的模型之前，我真的需要预处理输入数据（验证/测试数据）吗？

a) 如果是，可以得出结论，您必须始终了解在训练阶段执行了哪些预处理步骤？！

b) 如果不是：验证/测试数据的预处理是否会导致偏差？

我感谢您的帮助。

neural-network keras test-data image-preprocessing

2017-03-16T15:17:34.737

0 投票

1 回答

238 浏览

python-3.x - 更改数据表示“LabelBinarizer”后尺寸不匹配

l 有66类字符。l 训练了一个多层感知器，向它输入图像，每个图像的类别是一个字符

Aa..Zz 0-9 ,;:! è à ~

l 应用 aLabelBinarizer将每个字符转换为 66 个类的向量（例如[0 0 0 0 ....1 ...... 0]），因为模型不接受非数字数据。我很惊讶地得到y_test（错误的）和y_train（正确的 66）的维度 61。我的代码有什么问题？

**

x_test

y_train

y_test

当 l 应用LabelBinazerl 得到y_test维度(732,61)而不是(732,66) 66 时，表示类的数量：

(1708, 66)

(732, 61) #为什么我得到的是 61 而不是 66

按照建议进行更改后

编辑2：

我收到以下错误：

EDIT3： 我的 jupyter 代码：

python-3.x scikit-learn deep-learning keras image-preprocessing

2017-04-04T15:42:47.157

0 投票

1 回答

2700 浏览

ocr - 为什么 DPI 与相机为 OCR 拍摄的图像相关

我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目的过程中，我访问了很多网站，这些网站声称 Tesseract 在至少 300 DPI（每英寸点数）的图像上效果最好。

我的问题是为什么 DPI 被多次提到图像。我了解，当您扫描对象时，您希望以至少 300 DPI 进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知，DPI 是打印机的属性。基于此属性，它越高，图像越小，但质量越高。

现在，如果 DPI 与这些图像无关，那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时程序的结果会有所不同。是否有我不知道的 Tesseract 预处理？

ocr tesseract dpi tess4j image-preprocessing

2017-04-12T07:29:38.833

0 投票

0 回答

2334 浏览

generator - 如何确定 Keras 中增强图像的数量？

我正在使用 Keras 2.0.0，我想在 GPU 上训练一个具有大量参数的深度模型。由于我的数据很大，我必须使用ImageDataGenerator. 老实说，我想ImageDataGenerator在这个意义上滥用，我不想执行任何增强。我只想将我的训练图像成批（并重新调整它们），这样我就可以将它们提供给model.fit_generator.

我从这里修改了代码，并根据我的数据做了一些小的改动（即将二进制分类改为分类。但这对于应该在这里讨论的这个问题无关紧要）。我有 15000 张火车图像，我想要执行的唯一“增强”是将范围 [0,1] 重新缩放到train_datagen = ImageDataGenerator(rescale=1./255). 创建我的 'train_generator' 后：

我通过使用来拟合模型model.fit_generator()。

我将时期的数量设置为：epochs = 1 并将 batch_size 设置为：batch_size = 60

我希望在存储我的增强（即调整大小）图像的目录中看到：每个时期 15.000 个重新缩放的图像，即只有一个时期：15.000 个重新缩放的图像。但是，神秘的是，有 15.250 张图像。

有这么多图像的原因吗？我是否有权控制增强图像的数量？

类似的问题：

模型 fit_generator 未按预期提取数据样本（分别在 stackoverflow：Keras - How are batches and epochs used in fit_generator()?）

为 ImageNet 等大型数据集使用数据生成器的具体示例

我感谢您的帮助。

generator keras image-preprocessing

2017-04-25T08:08:04.360

0 投票

0 回答

379 浏览

image - 图像预处理以提高 OCR 的准确性

我在 OpenCV 中使用高斯核进行图像增强，具有 250% 的放大率：

但仍然没有给出很好的结果。我应该做哪些其他预处理来提高准确性？我正在使用ocr.space作为工具。

一些例子：

英语语言：

它错误地将 KIHC US检测为KI-IC US

英语语言：

它错误地将HRL US检测为HRI-US （倒数第二行）

英语语言：

它没有检测到BN FP

英语语言：

它错误地将HPQ US检测为I-IPQ US（但在下一行的 HEN3 GR 中正确检测到 H）
它错误地将 LALAB MM检测为I-ALAB MM
它没有检测到RB/LN

image opencv computer-vision ocr image-preprocessing

2017-04-25T10:19:55.687

0 投票

1 回答

1074 浏览

c++ - 将图像magick命令转换为magick++ c++代码

我正在我的大学从事图像预处理项目，并使用图像魔法脚本来清理图像背景。现在我想通过 Magick++（用于 imageMagick 的 c++ api）获得相同的输出。

ImageMagick 命令：“转换-尊重括号（INPUT_IMAGE.jpg -colorspace gray -contrast-stretch 0）（-clone 0 -colorspace gray -negate -lat 25x25+30% -contrast-stretch 0）-compose copy_opacity -composite -fill白色 - 不透明无 -alpha 关闭 - 背景白色 OUTPUT_IMAGE.jpg"

我试图将此代码转换为 Magick++ 代码，但在“-lat”、“-contrast-stretch”和“-compose”位置失败。

到目前为止，这是我的 C++ 代码：

如果有人有想法或更好的解决方案，请告诉我。提前谢谢。

c++imagemagick magick++image-preprocessing

2017-04-26T06:49:53.820

0 投票

1 回答

1212 浏览

python - Tensorflow：tf.image.central_crop 的问题

我面临以下问题tf.image.central_crop()

哪个输出

该central_crop()函数似乎丢失了有关图像张量的高度和宽度的信息。为什么会这样？

python image machine-learning tensorflow image-preprocessing

2017-05-19T12:19:27.593

0 投票

1 回答

334 浏览

tensorflow - 将我自己的图像数据转换为 TFRecords

现在我正在练习将自己的图像数据转换为 tensorflow 的 TFRrcords。我对 tensorflow 非常陌生，所以我只是修改了从 Github 获得的 build_image_data.py。

这是原始代码的一些部分：

我将它们替换为：

但我收到如下错误：

有人可以帮助我，拜托。

谢谢。

tensorflow image-preprocessing

2017-05-21T13:42:39.190

问题标签 [image-preprocessing]

x_test

Reference