我正在建立一个网站,该网站使用计算机视觉技术做一些很酷的事情,用户使用他们的网络摄像头实时录制和上传视频。为此,我需要相机内在和失真参数。考虑到用户上传的视频,我试图找出计算这些的最佳方法。我们不能对用户可能上传的视频做出任何假设 - 但一个合理的假设是视频中可能存在人类。我仍处于初始阶段,但我很想知道其他人是如何解决这个问题的。
具体来说,以下是我希望小组中有经验的人可能会评论的问题:
- 有哪些算法、库和技术可用于提取市场上任何通用网络摄像头的固有参数和失真参数?[我说“提取”而不是“校准”以包括内在参数只是一种方法调用而无需校准的情况]。
- 一般来说,您在市场上可用的网络摄像头的内在参数和失真参数中观察到多少差异?您是否使用单一的内在参数和失真参数来近似它们,或者您采用什么方法?
- 在这些场景中可以采用哪些相机自校准方法(如果有)?是否有任何可用的开源或商业库可能会有所帮助?
- 如果我们的目标是使用用户记录和上传的视频来校准网络摄像头,那么参数中的哪些假设 [如 fx==fy 或无失真参数] 对您来说是合理且合理的?
- 所有相机的内在参数和失真参数的合理近似是否有意义?验证特定网络摄像头的特定内在参数和失真参数有多好的合理方法是什么?
- 还有其他需要考虑的问题吗?