问题标签 [image-preprocessing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
27 浏览

matlab - 在通过 MATLAB 使用 PCA 之前,我可以对图像 BMP 进行哪些预处理?

我有 BMP 图像。我想以兼容的方式对其进行预处理,该方式可以通过使用 PCA 进行特征提取来处理。

0 投票
1 回答
30 浏览

computer-vision - 为什么在 CNN 中进行图像识别任务时,总是选择非常本地化的过滤器?

在 CNN 中,滤波器通常在空间上设置为 3x3、5x5。尺寸可以与图像尺寸相媲美吗?一个原因是为了减少要学习的参数数量。除此之外,还有其他关键原因吗?例如,人们想先检测边缘?

0 投票
2 回答
2089 浏览

python - 在 Keras 中编写用于图像预处理的自定义函数

我是一名初学者,使用该keras_flow_from_dataframe课程训练有关糖尿病视网膜病变的图像数据集。但我的模型一直欠拟合。所以我尝试了预处理,通过编写一个自定义预处理函数来传递到我的图像数据生成器类中,使用 OpenCV 的自适应阈值实现。当我在 Keras 之外使用它时,该函数工作得很好,但是当我将它添加到我的图像数据生成器类并适合我的模型时,它会bad argument type for built-in operation在我的第一个 epoch 开始之前返回一个类型错误。

这是预处理代码:

当我用我的数据帧中的图像测试它时,它在 Keras 之外运行良好,但是当我将它添加到我的图像数据生成器类时,它会引发错误。

然后我从数据框中加载我的数据集:

然后我使用 拟合模型model.fit_generator,然后抛出类型错误:bad argument type for built-in operation

我还考虑过对图像进行预处理并将它们保存到一个文件夹中,然后我会将它们从该文件夹加载到一个数据帧中,但它的计算成本高且耗时。

0 投票
4 回答
15980 浏览

python - 调整图像大小时出错:“错误:(-215:Assertion failed) func != 0 in function 'resize'”

我正在尝试通过将图像重新缩放为 (10, 10) 来预处理图像数据集,该数据集以 numpy 数组表示,形状为 (28, 28) 的图像。我为此写了一个函数:

但是当我真正尝试重新调整它们时,我收到以下错误cv2.resize

在谷歌中,我只发现在 c++ 上写同样错误的人在做非常不同的事情,比如这个:调整图像大小并改变它的深度和这个:http ://answers.opencv.org/question/19715/error-215- func-0-in-function-convertto/

我如何解决它?

0 投票
0 回答
149 浏览

python - 将 3d 椭球拟合到 3d 图像

我有一个 3d 像素数据,我想将椭球拟合到它。有没有办法让椭球适合 3d 图像。

到目前为止,我已经在我的数据中包含了一个椭球并对其进行了旋转。我一直在尝试通过在 python 中手动调整椭圆体,方法是为每个所需的旋转更改椭圆体的 x、y、z 轴的半长轴。

我希望获得的是一种椭圆体旋转的自动方式,并且每次旋转到不同的角度时,它都会使椭圆体适合数据。

下图以蓝色描述数据,以红色描述椭圆体。在图 1 和图 2 中,红色的椭球已经以不同的角度旋转。拟合是在 python 中通过在第一张图中手动更改椭球的参数来完成的。

这是蓝色的数据和红色的旋转椭球

另一个以不同角度旋转的图像

拟合必须使图像中的所有细长结构都应与椭圆体拟合。正如我们在下图中看到的,有很多细长的结构,特别是在图像的下端,需要进行拟合。

0 投票
0 回答
422 浏览

python - Python scikit - 图像检测并从噪声图像中删除线条

我想从噪声图像中删除线条,例如:

IMAGE_NOISED

我使用了诸如腐蚀、膨胀和阈值、去噪 tv 之类的过滤器等形态学操作来去除大部分噪声,但是我在这张图像上有这些线,然后想去除,我已经尝试过霍夫线,让我们讨论一下技术,从图像中提取线条的函数或算法?

是否有任何基于机器学习的技术来预处理图像?

我测试了此链接中存在的大多数算法: Scikit Image - 示例

而且我没有得到好的结果:(。

0 投票
1 回答
763 浏览

android - 如何修复tensorflow和android studio之间的图像预处理差异?

我正在尝试使用 keras 构建分类模型并将模型部署到我的 Android 手机。我使用该网站上的代码将我自己的转换模型(一个 .pb 文件)部署到我的 Android 手机。我从手机加载图像,一切正常,但预测结果与我从 PC 得到的结果完全不同。

在我的电脑上测试的过程是:

  1. 用 cv2 加载图像,并转换为 np.float32

  2. 使用 keras resnet50 'preprocess_input' python 函数对图像进行预处理

  3. 扩展图像尺寸以进行批处理(批处理大小为 1)

  4. 将图像转发到模型并得到结果

相关代码:

而且我注意到Android的图像预处理部分与我在keras中使用的方法不同,它的模式是caffe(将图像从RGB转换为BGR,然后将每个颜色通道相对于ImageNet数据集归零)。似乎原始代码用于模式 tf(将在 -1 到 1 之间缩放像素)。

所以我将下面的'preprocessBitmap'代码修改为我认为应该的,并使用像素值[127,127,127]的3通道RGB图像来测试它。该代码预测的结果与 .h5 模型的结果相同。但是当我加载图像进行分类时,预测结果与 .h5 模型不同。

有人知道吗?非常感谢。

我尝试了以下方法:

  1. 在我的手机中加载一个像素值为 [127,127,127] 的 3 通道 RGB 图像,并使用下面的修改代码,它会给我一个与在 PC 上使用 .h5 模型的预测结果相同的预测结果。

  2. 使用带有图像的 tensorflow gfile 模块在 PC 上测试转换后的 .pb 模型,它给了我正确的预测结果(与 .h5 模型相比)。所以我认为转换后的 .pb 文件没有任何问题。

preprocessBitmap 的整个部分

0 投票
1 回答
268 浏览

tensorflow - 如何在使用 Keras flow_from_directory 时沿深度轴组合两个 RGB 图像以准备 6 通道输入数据?

train_generator 使用 Keras flow_from_directory 从磁盘读取批量 RGB 图像数据(下面的示例代码)。但就我而言,我有两个图像目录,因此我想读取一对图像并将它们沿深度轴堆叠以在它之前形成一个 6 通道图像(即 2x R、2x G、2x B 通道)转到 fit_generator。

所以,我的问题是如何在使用 Keras flow_from_directory 的同时沿深度轴组合两个 RGB 图像来准备 6 通道输入数据?

我正在从这里关注一个用于分类的示例 CNN 代码:

https://gist.github.com/fchollet/0830affa1f7f19fd47b06d4cf89ed44d

0 投票
4 回答
2285 浏览

python - 如何在python中检测和旋转图像

我有多个要解析的 pdf 发票。我将它们转换为图像并使用 ocr 从图像中获取文本。其中一个 pdf 有 3 页中的 2 页旋转 90 度。我如何检测这些旋转的页面并正确旋转它们以使 ocr 返回正确的信息?

0 投票
1 回答
339 浏览

python-3.x - 对数据集应用预处理

我正在用 pytorch 实现一篇关于图像分割的论文。我需要做一些预处理步骤,但因为我是第一次尝试,所以我无法将它们合并到传统的管道中。以下是预处理步骤-

1) N(w, h) = I(w, h) − G(w, h), (1) 其中N为归一化图像,I为原始图像,G为核大小为65的高斯模糊图像*65 和 0 均值和标准差 10。

2)归一化平均图像并将每个像素除以平均标准差。

以下是我上述步骤的代码片段-

我真的不确定如何在传统的 pytorch 数据加载器管道中添加上述功能,例如首先我应该使用ImageFolder然后应用加载数据集或先应用然后使用ImageFolder方法。