目前,我想使用自动编码器来减少输入数据的大小,以便将减少的数据用于另一个神经网络。我的任务是拍摄视频,然后将视频图像提供给自动编码器。当我只使用几张图像作为输入时,自动编码器工作得很好,但是当我想要一个图像序列时,它就不行了。
想象一下从一个移动的球中拍摄视频。例如,我们有 200 张图像。如果我对 200 张图像使用自动编码器,则误差很大,但如果我只使用 5 张图像,则重建误差很小并且可以接受。似乎自动编码器没有学习球循环的顺序或时间运动。我也尝试表示堆叠自动编码器,但结果并不好。
有谁知道问题是什么,或者可以使用自动编码器来完成这项任务?