computer-vision - Mask RCNN 中使用什么样的图像进行训练（只有 8 位或 16 位图像或任何深度）？

Question

我对用于训练目的的 MaskRCNN 图像有一点疑问。MRCNN 是否只使用 8 位图像进行训练？如果它拍摄任何 16 位或 32 位图像，它将如何通过培训帮助我们？通常可视化发生在 8 位图像上。如果它处理 16 位，它将如何帮助分类和映射，我有一个难题。

score 1 · Accepted Answer

只要您保持数据类型相同并且图像强度范围对于所有输入图像都是“一致的”，那么它应该没问题。例如，如果我们更喜欢 8 位图像，则应将 16 位和 32 位图像重新缩放为 8 位，即输入图像应为 uint8 类型 - 值在 [0,255] 之间。在使用大多数机器学习模型进行训练和推理时，需要这种类型的“预处理”。

在matterport/Mask_RCNN的示例之一中，输入图像的类型为 uint8。

或者，为什么不将图像转换为浮点类型和范围 [0,1]，从而保留 16 位和 32 位图像的像素分辨率？希望这可以帮助。

computer-vision - Mask RCNN 中使用什么样的图像进行训练（只有 8 位或 16 位图像或任何深度）？

1 回答 1

Related

Reference