问题标签 [image-preprocessing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何调整 VisDrone 数据集的大小并相应地更改注释文件?
我正在使用 VisDrone 数据集来训练 MobileNet-YOLOV3。该数据集包含不同大小的图像,即 960 x 540 P、1920 x 1080 P 等,以及每个图像的注释文件。但是当我训练 YOLO 模型时,它会将所有图像的大小调整为 416 x 416 P,这会导致在训练和测试期间丢失一些小对象。它还有一个问题,当调整大小时,注释可能是错误的,因为调整大小的图像的边界框必须不同。
所以我的问题是如何同时调整或裁剪这些图像以及相关注释?我对每个图像都有 .txt 和 .xml 注释文件。
另一种解决方案是裁剪每个图像并将其转换为新的 2 到 4 个图像,并根据旧注释相应地创建新注释。可以从一张图像中裁剪 4 幅图像,但是否可以根据裁剪区域将一个原始注释文件转换为新的 4 个注释文件?
python - sklearn.utils.class_weight 抛出“类应该包括所有可以在 y 中的有效标签”错误
为了“方便”,我尝试使用 sklearn.utils.class_weight,compute_class_weight 函数
但是,我得到“类应该包括所有可以在 y 中的有效标签”错误;尽管如此,我 100% 确信我给出了所有的类标签。
所以这没有问题;拿镜头:
只是为了确保形状:
所以是的,我有一个训练样本向量;而且我知道四五个班级完全占主导地位,所以我想增加一些班级权重。
我在这里。这里有什么问题?
python - 正方体选项和图像预处理
亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。
单击顶部的链接以查看我正在尝试 OCR 的图像
我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?
我根本没有选择,或者没有选择:
编辑 :
有趣的是,我尝试了多种方法:
- Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置错误)
- Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
- buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
- 来自 Ubuntu 上 Python Jpyter Notebook 的 Google API => 'U000241\n'
所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。
但我很想听听您对图像预处理的建议!:-)
所以如果你有建议。
问候 !
python-3.x - 如何将图像附加到 Keras 网络内的列表中
我想将 ImageDataGenerators 获取的图像附加到两个不同的列表中。我相信我可以使用 lambda 层做到这一点,但我收到一条错误消息。有关玩具示例,请参见下面的代码。您可以使用任何一组图像来运行代码。我使用了这里找到的猫狗数据集:“ https://download.microsoft.com/download/3/E/1/3E1C3F21-ECDB-4869-8368-6DEBA77B919F/kagglecatsanddogs_3367a.zip ”
python - 如何使用具有两个输入和两个输出并使用两个 ImageDataGenerator 方法 (flow_from_directory) 的功能 API 训练 Keras 模型
我想使用具有两个输入和两个输出的功能性 Keras API 创建一个模型。该模型将使用该ImageDataGenerator.flow_from_directory()
方法的两个实例从两个不同的目录(分别为输入 1 和输入 2)获取图像。
该模型还使用两个 lambda 层将生成器生成的图像附加到列表中以供进一步检查。
我的问题是如何训练这样的模型。这是一些玩具代码:
python - 如何从opencv中完全水平结构的非网格样式图像中提取字符串?
我正在使用 opencv 和 pytesseract 处理合同表。我想提取水平结构中的字符串(检查图像)。
我正在尝试使用 getStructureElement 来构造 if 进行膨胀,但我的代码跳转到图像中心的下一行,它从图像的左侧提取字符串,然后从所有左侧提取字符串然后移动到图像的右侧。
代码是:
python - ImageDataGenerator 不喜欢我的 fashionMNIST 数据集。它需要哪个输入?
我有一组来自 tensorflow 基本图像分类指南的名为 train_images 和 train_labels 的集合:
https://www.tensorflow.org/tutorials/keras/classification
我加载数据集:
这两个列表的形状分别是: (60000, 28, 28) (60000,)
之后我想使用 ImageDataGenerator 水平翻转一些图像,但是当我用我的火车列表拟合模型时,它返回我的错误,说 x 应该是一个秩为 4 的数组
我已经尝试过
所以形状变成(1,60000,28,28)(我必须这样做才能让模型检查单个图像)但它不适用于模型
这是代码的其余部分:
这是生成的错误:
实际上 train_images 是 (N° of images, width, height) 它等待的第 4 轴是什么?如何执行此操作?
python - Keras ImageDataGenerator.flow_from_directory 返回 TypeError
我正在尝试提供一个目录作为 ImageDataGenerator.flow_from_directory 的输入,但我无法做到。
上面的代码返回以下错误
我该如何解决这个问题?