希望这将消除一些误解,并让您更好地了解通用着色器存储的设置方式。
您必须了解的是缓冲区对象在 GL 中是如何工作的。您经常听到人们区分“顶点缓冲区对象”和“统一缓冲区对象”之类的东西。实际上,没有根本的区别——缓冲区对象无论存储什么,都以相同的方式处理。它只是一个通用数据存储,只有在绑定到特定点(例如GL_ARRAY_BUFFER
或GL_UNIFORM_BUFFER
)时才具有特殊含义。
不要考虑驻留在 GPU 上的特殊用途的顶点缓冲区,而是更一般地考虑 - 它实际上是未格式化的内存,如果您知道结构,您可以读取/写入。像这样的调用glVertexAttribPointer (...)
充分描述了缓冲区对象的数据结构,以便glDrawArrays (...)
为每个顶点着色器调用从缓冲区对象的内存中有意义地提取顶点属性。
您需要自己为计算着色器做同样的事情,如下所示。您需要熟悉7.6.2.2 - 标准统一块布局中讨论的规则才能完全理解以下数据结构。
使用着色器存储块对顶点数据结构的描述可以这样完成:
// Compute Shader SSB Data Structure and Buffer Definition
struct VtxData {
vec4 vtx_pos; // 4N [GOOD] -- Largest base alignment
vec3 vtx_normal; // 3N [BAD]
float vtx_padding7; // N (such that vtx_st begins on a 2N boundary)
vec2 vtx_st; // 2N [BAD]
vec2 vtx_padding10; // 2N (in order to align the entire thing to 4N)
}; // ^^ 12 * sizeof (GLfloat) per-vtx
// std140 is pretty important here, it is the only way to guarantee the data
// structure is aligned as described above and that the stride between
// elements in verts[] is 0.
layout (std140, binding = 1) buffer VertexBuffer {
VtxData verts [];
};
这允许您在计算着色器中使用交错的顶点缓冲区,并使用上面定义的数据结构。执行此操作时,您必须小心数据对齐...您通常可以随意使用任何您想要的交错顶点数组的对齐/步幅,但在这里您要符合std140
布局规则。这意味着使用三分量向量并不总是明智地使用内存。您需要在 N ( float
)、2N ( vec2
) 或 4N ( vec3
/ vec4
) 边界上对齐内容,这通常需要插入填充和/或巧妙地打包数据。在上面的示例中,您可以在对齐填充浪费的所有空间中拟合整个 3 分量向量的数据。
显示缓冲区将如何创建和绑定以供双重使用的伪代码:
struct Vertex {
GLfloat pos [4];
GLfloat normal [3];
GLfloat padding7;
GLfloat st [2];
GLfloat padding10 [2];
} *verts;
[... code to allocate and fill verts ...]
GLuint vbo;
glGenBuffers (1, &vbo);
glBindBuffer (GL_ARRAY_BUFFER, vbo);
glBufferData (GL_ARRAY_BUFFER, sizeof (Vertex) * num_verts, verts, GL_STATIC_DRAW);
glVertexAttribPointer (0, 4, GL_FLOAT, GL_FALSE, 48, 0); // Vertex Attrib. 0
glVertexAttribPointer (1, 3, GL_FLOAT, GL_FALSE, 48, 16); // Vertex Attrib. 1
glVertexAttribPointer (2, 2, GL_FLOAT, GL_FALSE, 48, 32); // Vertex Attrib. 2
glBindBufferBase (GL_SHADER_STORAGE_BUFFER, 1, vbo); // Buffer Binding 1