问题标签 [image-preprocessing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
714 浏览

python - 如何调整 VisDrone 数据集的大小并相应地更改注释文件?

我正在使用 VisDrone 数据集来训练 MobileNet-YOLOV3。该数据集包含不同大小的图像,即 960 x 540 P、1920 x 1080 P 等,以及每个图像的注释文件。但是当我训练 YOLO 模型时,它会将所有图像的大小调整为 416 x 416 P,这会导致在训练和测试期间丢失一些小对象。它还有一个问题,当调整大小时,注释可能是错误的,因为调整大小的图像的边界框必须不同。

所以我的问题是如何同时调整或裁剪这些图像以及相关注释?我对每个图像都有 .txt 和 .xml 注释文件。

另一种解决方案是裁剪每个图像并将其转换为新的 2 到 4 个图像,并根据旧注释相应地创建新注释。可以从一张图像中裁剪 4 幅图像,但是否可以根据裁剪区域将一个原始注释文件转换为新的 4 个注释文件?

0 投票
1 回答
710 浏览

python - sklearn.utils.class_weight 抛出“类应该包括所有可以在 y 中的有效标签”错误

为了“方便”,我尝试使用 sklearn.utils.class_weight,compute_class_weight 函数

但是,我得到“类应该包括所有可以在 y 中的有效标签”错误;尽管如此,我 100% 确信我给出了所有的类标签。

所以这没有问题;拿镜头:

只是为了确保形状:

所以是的,我有一个训练样本向量;而且我知道四五个班级完全占主导地位,所以我想增加一些班级权重。

我在这里。这里有什么问题?

0 投票
1 回答
1437 浏览

python - 如何使用python从图像中去除边界边缘噪声?

我正在尝试通过用 3 个随机数的平均像素值替换黑色区域来去除图像中的黑色边框和无关的非眼睛特征(例如,请参阅下面的文本和“剪辑”)来预处理眼血管的照片正方形。

但是,图像边框周围还有剩余的噪点,以及左下角的剩余文本和剪辑。

这是一个示例图像。

原来的 :

在此处输入图像描述

和后处理

在此处输入图像描述

您可以看到仍然存在黑灰色边框噪点以及右下角的文本和左下角的“剪辑”。在保持眼血管完整性的同时,我有什么办法可以尝试去除这些伪影吗?

感谢您的时间和帮助!

0 投票
1 回答
8998 浏览

python - 正方体选项和图像预处理

我尝试 OCR 的图像

编辑:如要求,这是原始图像

亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。

单击顶部的链接以查看我正在尝试 OCR 的图像

我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?

我根本没有选择,或者没有选择:

编辑 :

有趣的是,我尝试了多种方法:

  • Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置错误)
  • Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
  • buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
  • 来自 Ubuntu 上 Python Jpyter Notebook 的 Google API => 'U000241\n'

所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。

但我很想听听您对图像预处理的建议!:-)

所以如果你有建议。

问候 !

0 投票
0 回答
398 浏览

python - OpenCV Python - AbsDiff 最新变化

prev_frame_gray 是我的 videoCapture(0) 中拍摄的第一帧。它描绘了我拿着手机,而 c_frame_gray 是手机快速移动的下一帧。所以现在我只想要当前帧的变化。

在此处输入图像描述

如图所示,蓝色圆圈是第一帧的图像,红色圆圈是最新的变化。我只想要红色圆圈中的轮廓。我在这里做错了什么?或者我应该采取哪些额外的步骤?

0 投票
1 回答
409 浏览

python-3.x - 如何将图像附加到 Keras 网络内的列表中

我想将 ImageDataGenerators 获取的图像附加到两个不同的列表中。我相信我可以使用 lambda 层做到这一点,但我收到一条错误消息。有关玩具示例,请参见下面的代码。您可以使用任何一组图像来运行代码。我使用了这里找到的猫狗数据集:“ https://download.microsoft.com/download/3/E/1/3E1C3F21-ECDB-4869-8368-6DEBA77B919F/kagglecatsanddogs_3367a.zip

0 投票
1 回答
585 浏览

python - 如何使用具有两个输入和两个输出并使用两个 ImageDataGenerator 方法 (flow_from_directory) 的功能 API 训练 Keras 模型

我想使用具有两个输入和两个输出的功能性 Keras API 创建一个模型。该模型将使用该ImageDataGenerator.flow_from_directory()方法的两个实例从两个不同的目录(分别为输入 1 和输入 2)获取图像。

该模型还使用两个 lambda 层将生成器生成的图像附加到列表中以供进一步检查。

我的问题是如何训练这样的模型。这是一些玩具代码:

0 投票
1 回答
241 浏览

python - 如何从opencv中完全水平结构的非网格样式图像中提取字符串?

我正在使用 opencv 和 pytesseract 处理合同表。我想提取水平结构中的字符串(检查图像)。

我正在尝试使用 getStructureElement 来构造 if 进行膨胀,但我的代码跳转到图像中心的下一行,它从图像的左侧提取字符串,然后从所有左侧提取字符串然后移动到图像的右侧。

代码是:

此图像报告图像

0 投票
2 回答
412 浏览

python - ImageDataGenerator 不喜欢我的 fashionMNIST 数据集。它需要哪个输入?

我有一组来自 tensorflow 基本图像分类指南的名为 train_images 和 train_labels 的集合:

https://www.tensorflow.org/tutorials/keras/classification

我加载数据集:

这两个列表的形状分别是: (60000, 28, 28) (60000,)

之后我想使用 ImageDataGenerator 水平翻转一些图像,但是当我用我的火车列表拟合模型时,它返回我的错误,说 x 应该是一个秩为 4 的数组

我已经尝试过

所以形状变成(1,60000,28,28)(我必须这样做才能让模型检查单个图像)但它不适用于模型

这是代码的其余部分:

这是生成的错误:

实际上 train_images 是 (N° of images, width, height) 它等待的第 4 轴是什么?如何执行此操作?

0 投票
1 回答
1708 浏览

python - Keras ImageDataGenerator.flow_from_directory 返回 TypeError

我正在尝试提供一个目录作为 ImageDataGenerator.flow_from_directory 的输入,但我无法做到。

上面的代码返回以下错误

我该如何解决这个问题?