c++ - 使用 glDrawElementsInstanced 进行实例渲染时的行为不一致，有时没有渲染且没有错误

Question

我一直在使用 OpenGL 进行项目。使用实例化绘制调用渲染粒子。

问题是有时 glDrawElementsInstanced 不会渲染任何东西。并且没有错误报告。其他模型和效果渲染良好。但是我的粒子系统中没有粒子会渲染。绘图调用看起来像

ec(glBindVertexArray(vao));
ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));

ec是一个用于error check opengl 的宏。它有效地做到了这一点：

while (GLenum error = glGetError()){
    std::cerr << "OpenGLError:" << std::hex << error << " " << functionName << " " << file << " " << line << std::endl;
}

渲染粒子的问题在发布模式下更为普遍，而不是调试模式；但在两种模式下都会发生。该问题发生8/10在发布模式和1/10调试模式下。

下面是粒子的渲染过程：对于每个实例化的drawcall...

绑定共享顶点缓冲区对象（vbo）
将数据放入该顶点缓冲区对象（vbo）
遍历许多顶点数组对象（vao），将 VBO 与它们关联并设置顶点属性
渲染每个 vao

所有对象共享相同的 VBO，但按顺序呈现。整个应用程序当前是单线程的，所以这应该不是问题。

粒子 A（两个 vao）和 B（一个 vao）的给定框架如下：

-将 A 的数据缓冲到名为 VBO 的顶点缓冲区中
-绑定 A_vao1
-设置A的实例顶点属性
-绑定 A_vao2
-设置A的实例顶点属性
-渲染 A_vao1
-渲染 A_vao2
-缓冲区 B 的数据到顶点缓冲区名称 VBO（没有 glGenBuffers，这是同一个缓冲区）
-绑定 B_vao1
-设置B的实例顶点属性
-渲染 B_vao1

这种方法有明显的问题吗？

下面的源代码已被简化，但我留下了大部分相关部分。与我上面的不同，它实际上使用了 2 个共享顶点缓冲区对象 (VBO)，一个用于 matrix4s，一个用于 vector4s。

GLuint instanceMat4VBO = ...     //valid created vertex buffer objects
GLuint instanceVec4VBO = ...     //valid created vertex buffer objects

//iterate over all the instnaces; data is stored in class EffectInstanceData
for(EffectInstanceData& eid : instancedEffectsData) 
{
    if (eid.numInstancesThisFrame > 0) 
    {
        // ---- BUFFER data ---- before binding it to all VAOs (model's may have multiple meshes, each with their own VAO)
        ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMac4VBO)); //BUFFER MAT4 INSTANCE DATA
        ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::mat4) * eid.mat4Data.size(), &eid.mat4Data[0], GL_STATIC_DRAW));

        ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO)); //BUFFER VEC4 INSTANCE DATA
        ec(glBufferData(GL_ARRAY_BUFFER, sizeof(glm::vec4) * eid.vec4Data.size(), &eid.vec4Data[0], GL_STATIC_DRAW));

        //meshes may have multiple VAO's that need rendering, set up buffers with instance data for each VAO before instance rendering is done
        for (GLuint effectVAO : eid.effectData->mesh->getVAOs())
        {
            ec(glBindVertexArray(effectVAO));

            { //set up mat4 buffer

                ec(glBindBuffer(GL_ARRAY_BUFFER, instanceMat4VBO));
                GLsizei numVec4AttribsInBuffer = 4 * eid.numMat4PerInstance;
                size_t packagedVec4Idx_matbuffer = 0;

                //pass built-in data into instanced array vertex attribute
                {
                    //mat4 (these take 4 separate vec4s)
                    {
                        //model matrix
                        ec(glEnableVertexAttribArray(8));
                        ec(glEnableVertexAttribArray(9));
                        ec(glEnableVertexAttribArray(10));
                        ec(glEnableVertexAttribArray(11));

                        ec(glVertexAttribPointer(8, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
                        ec(glVertexAttribPointer(9, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
                        ec(glVertexAttribPointer(10, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));
                        ec(glVertexAttribPointer(11, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_matbuffer++ * sizeof(glm::vec4))));

                        ec(glVertexAttribDivisor(8, 1));
                        ec(glVertexAttribDivisor(9, 1));
                        ec(glVertexAttribDivisor(10, 1));
                        ec(glVertexAttribDivisor(11, 1));
                    }
                }
            }

            { //set up vec4 buffer
                ec(glBindBuffer(GL_ARRAY_BUFFER, instanceVec4VBO));

                GLsizei numVec4AttribsInBuffer = eid.numVec4PerInstance; 
                size_t packagedVec4Idx_v4buffer = 0;
                {
                    //package built-in vec4s
                    ec(glEnableVertexAttribArray(7));
                    ec(glVertexAttribPointer(7, 4, GL_FLOAT, GL_FALSE, numVec4AttribsInBuffer * sizeof(glm::vec4), reinterpret_cast<void*>(packagedVec4Idx_v4buffer++ * sizeof(glm::vec4))));
                    ec(glVertexAttribDivisor(7, 1));
                }
            }
        }

        //activate shader
        ... code setting uniforms on shaders, does not appear to be issue...

        //instanced render
        for (GLuint vao : eid.effectData->mesh->getVAOs()) //this actually results in function calls to a mesh class instances, but effectively is doing this loop
        {
            ec(glBindVertexArray(vao));
            ec(glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ebo));
            ec(glDrawElementsInstanced(GL_TRIANGLES, triangleElementIndices.size(), GL_UNSIGNED_INT, reinterpret_cast<void*>(0), instanceCount));
        }

        //clear data for next frame
        eid.clearFrameData();
    }
}


ec(glBindVertexArray(0));//unbind VAO's

这种可见性有什么问题吗？我已经调试过RenderDoc，当问题不存在时，事件浏览器中会出现一个绘图调用，如下图所示：

但是当问题确实发生时，绘图调用根本不会出现RenderDoc如下图所示：

这对我来说似乎很奇怪。我已经用调试器验证了绘图调用正在执行。但它似乎默默地失败了。

我尝试使用 nvidia nsight 进行调试，但通过 nvidia nsight 启动时无法重现它。

我已验证

实例 VBO 缓冲区大小不会改变或增长太大，它的大小是稳定的
制服是正确地找到价值
vao 绑定似乎以正确的顺序发生

系统规格：Windows 10；Opengl3.3，8gb内存；i7-8700k，NVIDIA GeForce GTX TITAN X

在我的笔记本电脑上也观察到问题，再现率大致相同。它有一个英特尔图形芯片。

github 链接到实际源代码，如果有人尝试编译，请告诉我，您需要将隐藏的 .suo 替换为我制作的副本以自动填写链接器设置。功能：ParticleSystem::handlePostRender

score 0 · Accepted Answer

事实证明，这不是实例化的问题。我实现了一个非实例版本并遇到了同样的问题。真正的问题在于我的渲染系统。当前，交换缓冲区和渲染粒子正在侦听同一个委托（事件），并且有时交换缓冲区会在事件广播时首先出现。所以顺序是：

清屏
渲染场景
交换缓冲区
渲染粒子
清屏
渲染场景
交换缓冲区
渲染粒子

因此，这些粒子永远不可见，因为它们在应该是下一帧的开始时立即被清除。

c++ - 使用 glDrawElementsInstanced 进行实例渲染时的行为不一致，有时没有渲染且没有错误

1 回答 1

Related

Reference