我正在训练各种 CNN(AlexNet、InceptionV3 和 ResNet)。该数据集由游戏的屏幕截图和一个包含 4 个类的数组组成,该数组将给定捕获的输入表示为 [w,a,s,d]。
为了减少我需要收集的数据,我研究了使用出现频率较低的类的镜像捕获。例如,如果我正在镜像左转捕获,我也会更改标签,因此 [0,1,0,0] 将变为 [0,0,0,1]。我不确定镜像是否会起作用,因为原始图像左下角的小地图包含 GPS 路线。
我还没有训练任何模型。
我正在通过opencv镜像图像并调整标签:
if choice[1]:
new_choice[1] = 0
new_choice[3] = 1
if choice[3]:
new_choice[1] = 1
new_choice[3] = 0
if new_choice != choice:
cv2.imshow('capture', img)
print("capture:", choice)
flip = cv2.flip(img, 1)
cv2.imshow('flipped', flip)
print("flipped:", new_choice)
镜像训练数据集会对 CNN 造成什么影响?
即它是否会看不到左下角的小地图,因为它只出现在一半的训练示例中?