我想即时将帧从 YUV420p 格式(或类似格式)转换为 ABGR 格式,并将结果帧作为纹理放入视频内存中。
我现在可以考虑两种方法:
- 让每个通道成为一个源纹理,并渲染到另一个纹理。
- 在计算着色器中“正常”执行。
我不太了解 GPU 中的规则。在我的卡片中,有 720 个着色器核心、36 个纹理单元和 16 个输出单元。这是否意味着在每个周期内,我最多可以采样 40 个纹理并输出 16 个像素,而我可以执行 720 个着色器操作?因此,如果我使用方法 1,即使我对每个像素只使用 2 或 3 个操作,我也会被限制为 16 个像素输出?如果我使用方法2,是否意味着只要我可以在45个周期内转换一个像素,它就会比使用方法1更快?