问题标签 [image-preprocessing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1555 浏览

c++ - 使用 C++ (OpenCV) 删除所有黑色像素并仅获取所需的图像

我试过 findNonZero 和 boundingRect。但没有什么能帮助我。我是 C++ OpenCV 的新手。我使用涉及 NumPy 的 Python OpenCV 做到了这一点,但不幸的是我无法在 C++ 中做同样的事情。

输入图像

在此处输入图像描述

Python:

我正在用 Objective C++ 编写代码来为 iOS 提供包装器。

0 投票
1 回答
38 浏览

deep-learning - 物体检测模型能否适应不同的视点通道

我有同一场景的深度和热图像,但视角略有不同。

我用来计算旋转/平移矩阵,以便将两个图像堆叠在 (300, 300, 2) 数组中。 但是像 SSD 或 Faster-R-CNN 这样的对象检测模型可以隐式学习这个矩阵吗?

我的标签框是在热图像上完成的

深度图中同一物体对应的像素即使不在同一个位置也会被使用吗?

这是 SSD 型号的示意图: 观点问题

我只淹没了框坐标预测(最佳先验和真实对象位置之间的增量)而没有相应的对象类预测(5 x 5 x 4xnb_classes)

我的第一个想法是,如果深度图像中的对象不在标签框内(这是在热图像上完成的),网络将检测到 2 个不同的对象并因预测深度图像上的对象而受到惩罚(因为没有标签此处的框),因此网络将学会忽略深度通道。

我对吗 ?或者网络有没有办法可以处理这个 pb 并学习如何在深度通道中使用像素?(另一个对象检测模型可以处理这个 pb 吗?)

我认为核心问题,直观地说,是卷积保持对象在整个网络中的定位,因此我们不能将通道 1 (x, y) 中的像素链接到通道 2 (x+delta, y+delta) 中的像素

感谢您的时间。

0 投票
1 回答
1398 浏览

c++ - OpenCV 处理 - 边缘检测和裁剪

如何从预处理图像中去除不规则的白色像素。

我试过做侵蚀,这会使所有像素变黑。

预处理后:

在此处输入图像描述

要求:

在此处输入图像描述

我的代码:

寻找建议!

0 投票
1 回答
120 浏览

python - 将 s3 上的 svs 文件直接下载到 AWS Lambda 中的 RAM 或无需本地下载即可打开

我想使用 AWS Lambda (Python) 进行图像 (svs) 预处理(创建图块等)。不幸的是,图像大约 1 GB,不适合 /tmp (512MB)。因此,我希望通过以下方式将图像直接加载到 RAM 中:

或直接将图片下载到 ramfs 或类似的东西:

在 svs 文件中也只需要 10 级中的 1 级。因此,如果有一种方法只能从 s3 存储桶中读取文件中的特定信息,那就太好了。

谢谢

0 投票
1 回答
278 浏览

c++ - 将图像魔法转换命令转换为魔法 ++ C++ 代码

将图像magick命令转换为magick++ c++代码

我是 Magick++ 的新手。我正在开发一个动态制作按钮图像对象的项目。浏览一些帮助页面,我能够创建以下转换命令来满足我的需求。现在我正在尝试将其迁移到 C++。提前感谢您的帮助。

0 投票
2 回答
1953 浏览

python - 裁剪图像后,如何找到新的边界框坐标?

这是我得到的收据图像,我使用 matplotlib 绘制了它,

收据图片

然后,我裁剪了原始的灰色图像并使用相同的边界框坐标再次绘制它,这是结果,

裁剪收据

所以,我正在寻找一种方法来制作边界框以适应裁剪后的图像。我不知道如何实现它。

编辑:

如果您想复制问题,这是另一个图像,receipt-2这些是图像的 b-box 坐标[1638,1462,2974,1462,2974,1549,1638,1549]

0 投票
0 回答
113 浏览

python - 将泡菜文件转换为图像会在循环中逐渐减慢

我正在尝试将以泡菜对象的形式存储的预处理数据集转换回图像。共有 820 张图像,分辨率为 227 227 或 299 299。我附上了下面的代码。

问题是,最初 tqdm 显示每秒有数百个文件被转换,但它几乎成倍地减慢,到第 500 个文件时,它下降到每秒 1 个文件。我不确定是什么原因造成的,并且遇到了使用并发来解决这个问题的建议。我尝试使用 Matplotlib 的 savefig 保存绘图,但遇到了同样的减速。

我想知道代码的哪一部分导致速度变慢以及如何解决它,因为我必须将多个 100 个泡菜文件转换回图像。

编辑:问题是程序内存不足并变慢。

0 投票
0 回答
317 浏览

python-3.x - 为什么泡菜转储大小大于原始图像数据集大小?

图像数据集包含大约70,000张图像。我试图从中创建 6 个泡菜文件。因此,每个 pickle 转储文件包含大约11519个预处理图像。磁盘上的图像文件夹大小约为2.5G。但是,每个 pickle 文件生成的大小为6.45G

总共6.45 * 6 = 38.7 G!!

这是预期的行为还是我做错了什么?我使用以下脚本生成泡菜文件。

0 投票
1 回答
134 浏览

machine-learning - 您认为解码器编码器 FCN 可以替代内核卷积算法吗?

我想尝试将自动编码器全连接卷积神经网络实现为 Unet,以将图像转换为另一个图像之间存在未知非线性关系的图像。

我有高斯核卷积算法,效果很好,但我想尝试一些机器学习方法。

您对其他 ANN 架构有任何想法吗?没有标准的全连接 ANN(已经尝试过,效果很好)非常感谢

0 投票
1 回答
416 浏览

image - 从 Tensorflow 中的图像张量中提取随机不重叠的补丁

我想用 Tensorflow 提取 3 个 80 x 80 的随机、不重叠的子图像。我怎么能做到?下面的图片应该给出一个想法。

问题说明