我对用于训练目的的 MaskRCNN 图像有一点疑问。MRCNN 是否只使用 8 位图像进行训练?如果它拍摄任何 16 位或 32 位图像,它将如何通过培训帮助我们?通常可视化发生在 8 位图像上。如果它处理 16 位,它将如何帮助分类和映射,我有一个难题。
问问题
383 次
1 回答
1
只要您保持数据类型相同并且图像强度范围对于所有输入图像都是“一致的”,那么它应该没问题。例如,如果我们更喜欢 8 位图像,则应将 16 位和 32 位图像重新缩放为 8 位,即输入图像应为 uint8 类型 - 值在 [0,255] 之间。在使用大多数机器学习模型进行训练和推理时,需要这种类型的“预处理”。
在matterport/Mask_RCNN的示例之一中,输入图像的类型为 uint8。
或者,为什么不将图像转换为浮点类型和范围 [0,1],从而保留 16 位和 32 位图像的像素分辨率?希望这可以帮助。
于 2019-08-06T15:08:01.807 回答