我正在为一个需要无标记相对姿势估计的 uni 项目工作。为此,我拍摄了两张图像并匹配图片某些位置的 n 个特征。从这些点我可以找到这些点之间的向量,当包含在距离中时,可以用来估计相机的新位置。
该项目需要可在移动设备上部署,因此算法需要高效。我必须使它更有效的一个想法是获取这些向量并将它们放入神经网络中,该神经网络可以获取向量并根据输入输出对 xyz 运动向量的估计。
我的问题是,如果训练有素,NN 是否适合这种情况?如果是这样,我将如何计算我需要的隐藏单元的数量以及最好的激活函数是什么?
我正在为一个需要无标记相对姿势估计的 uni 项目工作。为此,我拍摄了两张图像并匹配图片某些位置的 n 个特征。从这些点我可以找到这些点之间的向量,当包含在距离中时,可以用来估计相机的新位置。
该项目需要可在移动设备上部署,因此算法需要高效。我必须使它更有效的一个想法是获取这些向量并将它们放入神经网络中,该神经网络可以获取向量并根据输入输出对 xyz 运动向量的估计。
我的问题是,如果训练有素,NN 是否适合这种情况?如果是这样,我将如何计算我需要的隐藏单元的数量以及最好的激活函数是什么?
为您的应用程序使用神经网络可以很好地工作,但是,我觉得您需要大量的训练样本才能使网络泛化。当然,这也取决于您要处理的姿势的类型和数量。在我看来,通过一些巧妙的数学运算,可以直接从输入向量中导出运动向量——如果你有机会想出一种方法(或提供更多信息以便其他人可以考虑)也),这将是非常可取的,因为在这种情况下,您将包含有关该任务的先验知识,而不是依靠 NN 从数据中学习它。
如果您决定继续使用 NN 方法,请记住以下几点: