我正在从帧缓冲区读取单个像素的深度以实现拾取。最初我的 glReadPixels() 需要很长时间(5ms 左右),在 nVidia 上它甚至会在这段时间内消耗 100% 的 CPU 。在 Intel 上它也很慢,但是 CPU 空闲。
从那时起,我使用 PixelBufferObject 功能PBO来使 glReadPixels 异步并且还使用这个众所周知的示例进行双缓冲。
这种方法效果很好,让我异步调用 glReadPixels() ,但前提是我读取 RGBA值。如果我使用相同的 PBO 方法来读取深度值,则 glReadPixels() 会再次阻塞。
读取 RGBA:glReadPixels() 需要 12µs。
读取深度:glReadPixels() 需要 5ms。
我在 nVidia 和 Intel 驱动程序上试过这个。具有不同的格式/类型组合。我试过了:
glReadPixels( srcx, srcy, 1, 1, GL_DEPTH_COMPONENT, GL_FLOAT, 0 );
和:
glReadPixels( srcx, srcy, 1, 1, GL_DEPTH_STENCIL, GL_UNSIGNED_INT_24_8, 0 );
和:
glReadPixels( srcx, srcy, 1, 1, GL_DEPTH_STENCIL, GL_FLOAT_32_UNSIGNED_INT_24_8_REV, 0 );
这些都不会导致异步 glReadPixels() 调用。但是,如果我通过以下调用读取 RGBA 值:
glReadPixels( srcx, srcy, 1, 1, GL_RGBA, GL_UNSIGNED_BYTE, 0 );
然后 glReadPixels() 立即返回,因此不再阻塞。
在读取单个像素之前,我会:
glReadBuffer( GL_FRONT );
glBindBuffer( GL_PIXEL_PACK_BUFFER, pboid );
我创建了双缓冲 PBO:
glGenBuffers( NUMPBO, pboids );
for ( int i=0; i<NUMPBO; ++i )
{
const int pboid = pboids[i];
glBindBuffer( GL_PIXEL_PACK_BUFFER, pboid );
glBufferData( GL_PIXEL_PACK_BUFFER, DATA_SIZE, 0, GL_STREAM_READ );
...
我使用深度大小为 24、模板大小为 8 和默认双缓冲区的 SDL2 创建我的帧缓冲区。
我在 Ubuntu LTS 上使用 OpenGL Core Profile 3.3。