1

我正在尝试使用 OpenGL 渲染 3 个四边形(1 个 bg,2 个精灵)。我有以下代码:

void GLRenderer::onDrawObjects(long p_dt)
{
    float _log_last_time = ELAPSED_MS;
    fprintf(stdout, "-- starting draw: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time);

    glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);

    for(std::vector<queuedRenderable*>::iterator itr = m_displayList.begin();
        itr != m_displayList.end();
        itr++)
    {
        Sprite* spriteToRender = (*itr)->m_sprite;

        float _log_last_time1 = ELAPSED_MS;
        fprintf(stdout, "---- profiling object: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time1);

        glMatrixMode( GL_MODELVIEW );
        glLoadIdentity();

        // glTranslate, glRotate, glScale goes here

        fprintf(stdout, "---- transform done: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time1);
        _log_last_time1 = ELAPSED_MS;

        glEnable(GL_TEXTURE_2D);
        glBindTexture(GL_TEXTURE_2D, (*itr)->m_material->m_glId);

        fprintf(stdout, "---- set material done: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time1);
        _log_last_time1 = ELAPSED_MS;

        unsigned listIds[] = {
            (*itr)->m_mesh->m_glId
        };
        glCallLists(1, GL_UNSIGNED_INT, listIds);

        fprintf(stdout, "---- draw mesh done: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time1);
        _log_last_time1 = ELAPSED_MS;
    }

    fprintf(stdout, "-- flushing to card: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time);
    _log_last_time = ELAPSED_MS;

    glFlush();
    glFinish();

    fprintf(stdout, "-- flush done: %.4f, dTime: %.4f\n", ELAPSED_MS, ELAPSED_MS - _log_last_time);
    _log_last_time = ELAPSED_MS;
}

我在控制台中得到以下结果:

-- starting draw: 24000.0000, dTime: 0.0000
---- profiling object: 24014.0000, dTime: 0.0000
---- transform done: 24033.0000, dTime: 19.0000
---- set material done: 24046.0000, dTime: 0.0000
---- draw mesh done: 24066.0000, dTime: 1.0000
---- profiling object: 24084.0000, dTime: 0.0000
---- transform done: 24102.0000, dTime: 18.0000
---- set material done: 24120.0000, dTime: 0.0000
---- draw mesh done: 24305.0000, dTime: 164.0000
---- profiling object: 24319.0000, dTime: 0.0000
---- transform done: 24338.0000, dTime: 19.0000
---- set material done: 24356.0000, dTime: 0.0000
---- draw mesh done: 24375.0000, dTime: 2.0000
-- flushing to card: 24389.0000, dTime: 389.0000
-- flush done: 24424.0000, dTime: 18.0000

如您所见,第二个四边形的绘制需要很长时间(164 毫秒)。我不知道为什么会这样,因为它们都是四边形。我还检查了纹理(如果相关),但它比 bg(第一个四边形)小很多。如果它有任何相关性,我认为第一个四边形应该画得更长,而不是第二个。

我对 OpenGL 相当陌生(过去我做过很多 opengl,但只是初学者的东西)所以我对自己在做什么有一些了解。我只是不确定如何进一步优化它以删除 164 毫秒的过程。

如何删除或最小化 164 毫秒的进程?

我必须注意,我正在使用带有英特尔 GMA 450 机器的英特尔凌动。

4

1 回答 1

5

让我们假设这个神秘的ELAPSED_MS宏是一个周期精确的 CPU 计数器。我相当怀疑它是这样的,因为它似乎以毫秒为增量跳跃,但让我们假装是这种情况。

您分析 OpenGL 的方法是完全错误的。您没有测量渲染四边形所需的时间。您正在测量glFinish完成所需的时间。不能保证glFinish会在四边形完成渲染时返回。实际上,它可能会等待很长时间,可能是线程任务切换或其他什么。谁知道。

关键是您的分析方法不可靠。请停止使用它们。在 OpenGL 中获取实际渲染操作的分析数据的唯一准确方法是使用计时器查询(专门设计用于测试在 GPU 上完成操作需要多长时间)或使用专有扩展

微分析(如分析绘制四边形所需的时间)很难正确完成。特别是四边形绘图通常不值得打扰分析。

ELAPSED_MS 是 ((((float)clock()) / CLOCKS_PER_SEC) * 1000.0f)

那太没有帮助了。因为即使您的方法很好,clock也不是进行任何形式的计时的可靠方法。您必须使用特定于平台的 调用,或者像C++11 的 chrono(或 Boost 等价物)这样的平台中立库。

于 2012-10-26T04:14:04.893 回答