游戏使用软件渲染在内存中绘制全屏调色板(8 位)图像。
使用 OpenGL 将该图像放在屏幕上的最快方法是什么?
我尝试过的事情:
glDrawPixels
withglPixelMap
指定调色板,并让 OpenGL 进行调色板映射。性能非常糟糕(~5 FPS)。- 在软件中进行调色板映射(索引 -> BGRX),然后使用
glDrawPixels
. 性能更好,但 CPU 使用率仍然比使用DirectDraw
相同软件调色板映射的 32 位高得多。
我应该改用某种纹理吗?
- glDrawPixels 和 glPixelMap 来指定调色板,并让 OpenGL 做调色板映射。性能非常糟糕(~5 FPS)。
这并不奇怪。glDrawPixels 开始时不是很快,glPixelMap 将在 CPU 上进行索引/调色板→ RGB 转换,当然不是非常优化的代码路径。
- 在软件中进行调色板映射(索引 -> BGRX),然后使用 glDrawPixels 进行绘制。
glDrawPixels 是 OpenGL 中最慢的函数之一。这有两个主要原因:首先它是一个没有经过优化的代码补丁,其次它直接写入目标帧缓冲区,因此每次调用它都会强制管道同步。同样在大多数 GPU 上,它没有任何缓存支持。
我建议您将索引图像放入单通道纹理,例如 GL_R8(用于 OpenGL-3 或更高版本)或 GL_LUMINANCE8,并将您的调色板放入 1D RGB 纹理,以便用作纹理坐标的索引确实查找颜色。使用纹理作为 LUT 是完全正常的。通过这种组合,您可以使用片段着色器进行原位调色板索引到颜色的转换。
片段着色器看起来像这样
#version 330
uniform sampler2D image;
uniform sampler1D palette;
in vec2 texcoord;
void main()
{
float index = tex2D(image, texcoord).r * 255.f; // 255 for a 8 bit palette
gl_FragColor = texelFetch(palette, index, 0);
}