问题标签 [image-preprocessing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
deep-learning - 物体检测模型能否适应不同的视点通道
我有同一场景的深度和热图像,但视角略有不同。
我用来计算旋转/平移矩阵,以便将两个图像堆叠在 (300, 300, 2) 数组中。 但是像 SSD 或 Faster-R-CNN 这样的对象检测模型可以隐式学习这个矩阵吗?
我的标签框是在热图像上完成的。
深度图中同一物体对应的像素即使不在同一个位置也会被使用吗?
我只淹没了框坐标预测(最佳先验和真实对象位置之间的增量)而没有相应的对象类预测(5 x 5 x 4xnb_classes)
我的第一个想法是,如果深度图像中的对象不在标签框内(这是在热图像上完成的),网络将检测到 2 个不同的对象并因预测深度图像上的对象而受到惩罚(因为没有标签此处的框),因此网络将学会忽略深度通道。
我对吗 ?或者网络有没有办法可以处理这个 pb 并学习如何在深度通道中使用像素?(另一个对象检测模型可以处理这个 pb 吗?)
我认为核心问题,直观地说,是卷积保持对象在整个网络中的定位,因此我们不能将通道 1 (x, y) 中的像素链接到通道 2 (x+delta, y+delta) 中的像素
感谢您的时间。
python - 将 s3 上的 svs 文件直接下载到 AWS Lambda 中的 RAM 或无需本地下载即可打开
我想使用 AWS Lambda (Python) 进行图像 (svs) 预处理(创建图块等)。不幸的是,图像大约 1 GB,不适合 /tmp (512MB)。因此,我希望通过以下方式将图像直接加载到 RAM 中:
或直接将图片下载到 ramfs 或类似的东西:
在 svs 文件中也只需要 10 级中的 1 级。因此,如果有一种方法只能从 s3 存储桶中读取文件中的特定信息,那就太好了。
谢谢
c++ - 将图像魔法转换命令转换为魔法 ++ C++ 代码
将图像magick命令转换为magick++ c++代码
我是 Magick++ 的新手。我正在开发一个动态制作按钮图像对象的项目。浏览一些帮助页面,我能够创建以下转换命令来满足我的需求。现在我正在尝试将其迁移到 C++。提前感谢您的帮助。
python - 裁剪图像后,如何找到新的边界框坐标?
这是我得到的收据图像,我使用 matplotlib 绘制了它,
然后,我裁剪了原始的灰色图像并使用相同的边界框坐标再次绘制它,这是结果,
所以,我正在寻找一种方法来制作边界框以适应裁剪后的图像。我不知道如何实现它。
编辑:
如果您想复制问题,这是另一个图像,receipt-2
这些是图像的 b-box 坐标[1638,1462,2974,1462,2974,1549,1638,1549]
。
python - 将泡菜文件转换为图像会在循环中逐渐减慢
我正在尝试将以泡菜对象的形式存储的预处理数据集转换回图像。共有 820 张图像,分辨率为 227 227 或 299 299。我附上了下面的代码。
问题是,最初 tqdm 显示每秒有数百个文件被转换,但它几乎成倍地减慢,到第 500 个文件时,它下降到每秒 1 个文件。我不确定是什么原因造成的,并且遇到了使用并发来解决这个问题的建议。我尝试使用 Matplotlib 的 savefig 保存绘图,但遇到了同样的减速。
我想知道代码的哪一部分导致速度变慢以及如何解决它,因为我必须将多个 100 个泡菜文件转换回图像。
编辑:问题是程序内存不足并变慢。
python-3.x - 为什么泡菜转储大小大于原始图像数据集大小?
图像数据集包含大约70,000张图像。我试图从中创建 6 个泡菜文件。因此,每个 pickle 转储文件包含大约11519个预处理图像。磁盘上的图像文件夹大小约为2.5G。但是,每个 pickle 文件生成的大小为6.45G。
总共6.45 * 6 = 38.7 G!!
这是预期的行为还是我做错了什么?我使用以下脚本生成泡菜文件。
machine-learning - 您认为解码器编码器 FCN 可以替代内核卷积算法吗?
我想尝试将自动编码器全连接卷积神经网络实现为 Unet,以将图像转换为另一个图像之间存在未知非线性关系的图像。
我有高斯核卷积算法,效果很好,但我想尝试一些机器学习方法。
您对其他 ANN 架构有任何想法吗?没有标准的全连接 ANN(已经尝试过,效果很好)非常感谢