我在我的引擎中添加了一个新的 GL 渲染器,它使用核心配置文件。虽然它在 Windows和/或 nvidia 卡上运行良好,但在 OS X 上慢了 10 倍(3 fps 而不是 30)。奇怪的是,我的兼容性配置文件渲染器运行良好。
我用 Instruments 和 GL profiler 收集了一些痕迹:
https://www.dropbox.com/sh/311fg9wu0zrarzm/31CGvUcf2q
它表明应用程序将时间花在 glDrawRangeElements 中。我尝试了以下事情:
- 改用 glDrawElements (无效)
- 翻转剔除(对速度没有影响)
- 禁用一些 GL_DYNAMIC_DRAW 缓冲区(无效)
- 绘制时在VAO之后绑定索引缓冲区(无效)
- 将索引转换为 4 字节(无效)
- 使用 GL_BGRA 纹理(无效果)
我没有尝试将我的顶点对齐到 16 字节边界和/或将索引转换为 4 字节,但严重的是,如果这将是问题,那么为什么标准允许它呢?
我正在创建这样的上下文:
NSOpenGLPixelFormatAttribute attributes[] =
{
NSOpenGLPFAColorSize, 24,
NSOpenGLPFAAlphaSize, 8,
NSOpenGLPFADepthSize, 24,
NSOpenGLPFAStencilSize, 8,
NSOpenGLPFADoubleBuffer,
NSOpenGLPFAAccelerated,
NSOpenGLPFANoRecovery,
NSOpenGLPFAOpenGLProfile, NSOpenGLProfileVersion3_2Core,
0
};
NSOpenGLPixelFormat* format = [[NSOpenGLPixelFormat alloc] initWithAttributes:attributes];
NSOpenGLContext* context = [[NSOpenGLContext alloc] initWithFormat:format shareContext:nil];
[self.view setOpenGLContext:context];
[context makeCurrentContext];
尝试了以下规格:
- Radeon 6630M,OS X 10.7.5
- Radeon 6750M,OS X 10.7.5
- geforce GT 330M,OS X 10.8.3
你有什么想法我可能做错了吗?同样,它适用于兼容性配置文件(虽然不使用 VAO)。
更新:向苹果报告。
更新:Apple 并不在乎这个问题......无论如何,我创建了一个实际上很好的小型测试程序。现在我将调用堆栈与 Instruments 进行了比较,发现在使用引擎时,glDrawRangeElements进行了两次调用:
- gleDrawArraysOrElements_ExecCore
- gleDrawArraysOrElements_Entries_Body
而在测试程序中它只调用第二个。现在第一个调用执行类似于立即模式渲染(gleFlushPrimitivesTCLFunc,gleRunVertexSubmitterImmediate)的操作,因此显然会导致减速。