问题标签 [image-preprocessing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 在通过 MATLAB 使用 PCA 之前,我可以对图像 BMP 进行哪些预处理?
我有 BMP 图像。我想以兼容的方式对其进行预处理,该方式可以通过使用 PCA 进行特征提取来处理。
computer-vision - 为什么在 CNN 中进行图像识别任务时,总是选择非常本地化的过滤器?
在 CNN 中,滤波器通常在空间上设置为 3x3、5x5。尺寸可以与图像尺寸相媲美吗?一个原因是为了减少要学习的参数数量。除此之外,还有其他关键原因吗?例如,人们想先检测边缘?
python - 在 Keras 中编写用于图像预处理的自定义函数
我是一名初学者,使用该keras_flow_from_dataframe
课程训练有关糖尿病视网膜病变的图像数据集。但我的模型一直欠拟合。所以我尝试了预处理,通过编写一个自定义预处理函数来传递到我的图像数据生成器类中,使用 OpenCV 的自适应阈值实现。当我在 Keras 之外使用它时,该函数工作得很好,但是当我将它添加到我的图像数据生成器类并适合我的模型时,它会bad argument type for built-in operation
在我的第一个 epoch 开始之前返回一个类型错误。
这是预处理代码:
当我用我的数据帧中的图像测试它时,它在 Keras 之外运行良好,但是当我将它添加到我的图像数据生成器类时,它会引发错误。
然后我从数据框中加载我的数据集:
然后我使用 拟合模型model.fit_generator
,然后抛出类型错误:bad argument type for built-in operation
。
我还考虑过对图像进行预处理并将它们保存到一个文件夹中,然后我会将它们从该文件夹加载到一个数据帧中,但它的计算成本高且耗时。
python - 调整图像大小时出错:“错误:(-215:Assertion failed) func != 0 in function 'resize'”
我正在尝试通过将图像重新缩放为 (10, 10) 来预处理图像数据集,该数据集以 numpy 数组表示,形状为 (28, 28) 的图像。我为此写了一个函数:
但是当我真正尝试重新调整它们时,我收到以下错误cv2.resize
:
在谷歌中,我只发现在 c++ 上写同样错误的人在做非常不同的事情,比如这个:调整图像大小并改变它的深度和这个:http ://answers.opencv.org/question/19715/error-215- func-0-in-function-convertto/
我如何解决它?
python - 将 3d 椭球拟合到 3d 图像
我有一个 3d 像素数据,我想将椭球拟合到它。有没有办法让椭球适合 3d 图像。
到目前为止,我已经在我的数据中包含了一个椭球并对其进行了旋转。我一直在尝试通过在 python 中手动调整椭圆体,方法是为每个所需的旋转更改椭圆体的 x、y、z 轴的半长轴。
我希望获得的是一种椭圆体旋转的自动方式,并且每次旋转到不同的角度时,它都会使椭圆体适合数据。
下图以蓝色描述数据,以红色描述椭圆体。在图 1 和图 2 中,红色的椭球已经以不同的角度旋转。拟合是在 python 中通过在第一张图中手动更改椭球的参数来完成的。
拟合必须使图像中的所有细长结构都应与椭圆体拟合。正如我们在下图中看到的,有很多细长的结构,特别是在图像的下端,需要进行拟合。
python - Python scikit - 图像检测并从噪声图像中删除线条
我想从噪声图像中删除线条,例如:
我使用了诸如腐蚀、膨胀和阈值、去噪 tv 之类的过滤器等形态学操作来去除大部分噪声,但是我在这张图像上有这些线,然后想去除,我已经尝试过霍夫线,让我们讨论一下技术,从图像中提取线条的函数或算法?
是否有任何基于机器学习的技术来预处理图像?
我测试了此链接中存在的大多数算法: Scikit Image - 示例
而且我没有得到好的结果:(。
android - 如何修复tensorflow和android studio之间的图像预处理差异?
我正在尝试使用 keras 构建分类模型并将模型部署到我的 Android 手机。我使用该网站上的代码将我自己的转换模型(一个 .pb 文件)部署到我的 Android 手机。我从手机加载图像,一切正常,但预测结果与我从 PC 得到的结果完全不同。
在我的电脑上测试的过程是:
用 cv2 加载图像,并转换为 np.float32
使用 keras resnet50 'preprocess_input' python 函数对图像进行预处理
扩展图像尺寸以进行批处理(批处理大小为 1)
将图像转发到模型并得到结果
相关代码:
而且我注意到Android的图像预处理部分与我在keras中使用的方法不同,它的模式是caffe(将图像从RGB转换为BGR,然后将每个颜色通道相对于ImageNet数据集归零)。似乎原始代码用于模式 tf(将在 -1 到 1 之间缩放像素)。
所以我将下面的'preprocessBitmap'代码修改为我认为应该的,并使用像素值[127,127,127]的3通道RGB图像来测试它。该代码预测的结果与 .h5 模型的结果相同。但是当我加载图像进行分类时,预测结果与 .h5 模型不同。
有人知道吗?非常感谢。
我尝试了以下方法:
在我的手机中加载一个像素值为 [127,127,127] 的 3 通道 RGB 图像,并使用下面的修改代码,它会给我一个与在 PC 上使用 .h5 模型的预测结果相同的预测结果。
使用带有图像的 tensorflow gfile 模块在 PC 上测试转换后的 .pb 模型,它给了我正确的预测结果(与 .h5 模型相比)。所以我认为转换后的 .pb 文件没有任何问题。
preprocessBitmap 的整个部分
tensorflow - 如何在使用 Keras flow_from_directory 时沿深度轴组合两个 RGB 图像以准备 6 通道输入数据?
train_generator 使用 Keras flow_from_directory 从磁盘读取批量 RGB 图像数据(下面的示例代码)。但就我而言,我有两个图像目录,因此我想读取一对图像并将它们沿深度轴堆叠以在它之前形成一个 6 通道图像(即 2x R、2x G、2x B 通道)转到 fit_generator。
所以,我的问题是如何在使用 Keras flow_from_directory 的同时沿深度轴组合两个 RGB 图像来准备 6 通道输入数据?
我正在从这里关注一个用于分类的示例 CNN 代码:
https://gist.github.com/fchollet/0830affa1f7f19fd47b06d4cf89ed44d
python - 如何在python中检测和旋转图像
我有多个要解析的 pdf 发票。我将它们转换为图像并使用 ocr 从图像中获取文本。其中一个 pdf 有 3 页中的 2 页旋转 90 度。我如何检测这些旋转的页面并正确旋转它们以使 ocr 返回正确的信息?
python-3.x - 对数据集应用预处理
我正在用 pytorch 实现一篇关于图像分割的论文。我需要做一些预处理步骤,但因为我是第一次尝试,所以我无法将它们合并到传统的管道中。以下是预处理步骤-
1) N(w, h) = I(w, h) − G(w, h), (1) 其中N为归一化图像,I为原始图像,G为核大小为65的高斯模糊图像*65 和 0 均值和标准差 10。
2)归一化平均图像并将每个像素除以平均标准差。
以下是我上述步骤的代码片段-
我真的不确定如何在传统的 pytorch 数据加载器管道中添加上述功能,例如首先我应该使用ImageFolder
然后应用加载数据集或先应用然后使用ImageFolder
方法。