6

这里有一些大的性能问题

所以我想在 gpu 方面进行一些测量。

通过阅读这个线程,我围绕我的绘图函数编写了这段代码,包括 gl 错误检查和 swapBuffers()(确实禁用了自动交换)

        gl4.glBeginQuery(GL4.GL_TIME_ELAPSED, queryId[0]);
        {    
            draw(gl4);

            checkGlError(gl4);

            glad.swapBuffers();
        }
        gl4.glEndQuery(GL4.GL_TIME_ELAPSED);
        gl4.glGetQueryObjectiv(queryId[0], GL4.GL_QUERY_RESULT, frameGpuTime, 0);

而且由于 OpenGL 渲染命令应该是异步的(驱动程序可以在将它们全部发送到一起之前缓冲多达 X 个命令),我的问题基本上是:

  • 上面的代码是正确的

  • 我是对的,假设在新帧开始时,所有先前的 GL 命令(来自前一帧)都已在 gpu 上发送、执行和终止

  • 我假设当我得到查询结果glGetQueryObjectiv并且GL_QUERY_RESULT到目前为止所有 GL 命令都已终止时,我是对的?那就是OpenGL会等到结果可用(从线程)?

4

1 回答 1

5

是的,当您查询计时器时,它将阻塞直到数据可用,即直到 GPU 完成查询开始和结束之间发生的所有事情。为避免与 GPU 同步,您可以使用GL_QUERY_RESULT_AVAILABLE检查结果是否已经可用,然后再读取它们。这可能需要不那么直接的代码来密切关注打开的查询并定期检查它们,但它对性能的影响最小。每次都等待价值肯定会扼杀你的表现。

编辑:为了解决您的第二个问题,交换缓冲区并不一定意味着它将阻塞,直到操作成功。您可能会看到这种行为,但它很可能只是一个隐式glFlush的,并且命令缓冲区还不是空的。这也是更需要的行为,因为理想情况下,您希望立即从下一帧开始并保持 CPU 的命令缓冲区充满。不过,请查看实现文档以获取更多信息,因为这是实现定义的。

编辑 2:顺便说一句,检查错误最终可能会成为隐式同步,因此当您等待命令流中的错误检查时,您可能会看到命令缓冲区清空。

于 2015-05-07T15:14:52.277 回答