我使用 gstreamer + opencv 解码 12 个 480p5 的多流网络摄像机。对于 batch_size=1 和 batch_size=2,nano 模型的预测时间分别为 100ms 和 130ms。我使用线程进行 H264 硬件解码。我想知道如何同时处理 12 台摄像机的这个问题?我想知道在 Nvidia 演示中显示同时处理 8 个 1080p30 流,他们如何应对这个挑战。我猜他们不会同时将 8 个流的输入提供给模型,对吧?我认为他们将前两个摄像头作为 batch_size=2 输入,然后输入到模型中,然后将第二个两个摄像头输入到连续模型中,依此类推,对吧?如果是这样,假设它们同时将两个摄像机中的每一个都输入模型,并且同时解码 8 个流,因此如果我们在 T1 时间将前两个摄像机输入模型,则其余摄像机的帧(i.