1

glCompressedTexSubImage2D我在使用 ASTC 8x8 纹理的 Android 手机(Adreno 530 GPU)上遇到了一个奇怪的问题。我的设置最初包含一个用于促进异步纹理上传的 PBO,但我已将其缩减到最低限度以重现此问题。请注意,它作为本机插件托管在 Unity 5.5.2f1 中,因此 Unity 可能会在我的调用之间更改某些状态glCompressedTexSubImage2D

首先,我正在针对 Android 平台 24 进行编译,<GLES3/gl32.h>以便现在可以访问,并使用正确的标志和设置来启用 C++11 功能。

我定义了这个结构,它存储通过插件更新的每个纹理的状态:

enum texture_format
{
    ASTC_RGBA_8x8 = 57,
};

struct texture_data
{
    void* ptr;
    bool has_initialized;
    uint32_t width;
    uint32_t height;
    texture_format format;
    std::vector<uint8_t> cpu_buffer;
    std::mutex lock_cpu_buffer;
    uint32_t row;
};

我已经验证了来自 Unity 的数据是否正确传递,这是(为清楚起见而缩短的)函数,用于上传纹理:

data.lock_cpu_buffer.lock();

int bytesPerRow = data.width * 2; //Specific to ASTC 8x8 for now: (width / 8) * 16

int num_rows = data.cpu_buffer.size() / bytesPerRow;
if (num_rows <= 0)
{
    data.lock_cpu_buffer.unlock();
    return;
}

glBindTexture(GL_TEXTURE_2D, (GLuint)data.ptr);

//Just in case Unity is doing something with these
glPixelStorei(GL_UNPACK_ALIGNMENT, 4);
glBindBuffer(GL_PIXEL_UNPACK_BUFFER, 0);

glCompressedTexSubImage2D(GL_TEXTURE_2D, 0, 0, data.row, data.width, 8 * num_rows, GL_COMPRESSED_RGBA_ASTC_8x8, bytesPerRow * num_rows, data.cpu_buffer.data());

GLenum err = glGetError();
if (err != GL_NO_ERROR)
{
#if UNITY_ANDROID
    __android_log_print(ANDROID_LOG_VERBOSE, APPNAME, "glCompressedTexSubImage2D error %u", err);
#endif
}

//prepare buffer for future by copying remainder to beginning of vector and resizing (no allocation should happen here)
data.row += num_rows * 8;
std::copy(data.cpu_buffer.begin() + (bytesPerRow * num_rows), data.cpu_buffer.end(), data.cpu_buffer.begin());
data.cpu_buffer.resize(data.cpu_buffer.size() - (bytesPerRow * num_rows));

glBindTexture(GL_TEXTURE_2D, 0);

data.lock_cpu_buffer.unlock();

总而言之,我将任意数量的数据从 Unity 中的流推送到本机插件中的缓冲区(代替映射的 PBO 指针),然后一次上传多行通过glCompressedTexSubImage2D为了使事情变得更简单,我正在跳过流的前 16 个字节(文件头)并读取 4096 个字节的块(正好是一行的大小)。因此,std::copy 的最后一点目前实际上并没有复制任何数据。我已经通过记录尽可能多的数据来验证这一点,缓冲区每次都会从 4096 的精确倍数调整为 0。

如所写,此函数将成功yOffset = 0(根据规范,无论在该调用中上传了多少行,8 192 或 8 的任何倍数)。在第一次调用之后,所有其他调用都失败并显示GL_INVALID_VALUE. 如果我颠倒 Y 顺序(yOffset of data.height - (num_rows * 8)),那么最后一次调用是唯一成功的调用。

使用 GL_KHR_debug 进一步挖掘,我的实现返回“图像大小对压缩纹理无效”

04-10 18:35:26.218 24522 24541 V AsyncTexUpload: id=102 glCompressedTexSubImage2D(GL_TEXTURE_2D, 0, 0, 1432, 2048, 96, GL_COMPRESSED_RGBA_ASTC_8x8, 49152, ptr)
04-10 18:35:26.218 24522 24541 V AsyncTexUpload: Logged message 8246, 824C, 7FFFFFFF, 9146, image size is invalid for compressed texture
04-10 18:35:26.218 24522 24541 V AsyncTexUpload: glCompressedTexSubImage2D error 1281

此外,这是真正让我感到困惑的部分,如果我交换 xOffset 和 yOffset 以及宽度和高度,则纹理上传时不会出错。我的块都在不正确的位置,但这个错误永远不会发生。从文档中的表格计算 imageSize 时两个变体具有相同的 imageSize 值。注销参数时,我的 imageSize 值是相同的。

您可以在下面看到,这是在第一次上传后使用未初始化内存运行的原始代码:

原始代码截图

现在,随着 xOffset/yOffset 和宽度/高度翻转,整个纹理正在上传,但块未对齐(如果以错误的顺序上传块,您会期望什么)

价值观翻转

ASTC 是否有任何限制会导致这种行为?有没有其他人遇到过类似的事情?一些论坛帖子提到了一些导致上传失败的外部状态变化,我还没有找到任何东西(这包括 glActiveTexture,上面的代码中没有显示)。为什么交换参数会导致错误消失?

4

1 回答 1

2

这些似乎是 OpenGL 特定实现中的错误。我已经用多种设备查看了这个,我上面提供的代码自 4 月以来已经显着成熟。

高通设备似乎希望纹理的大小达到行。也就是说,ceil(width/8) * ceil(height/8) * 16公式不是我所期望的,而是ceil(width/8) * ceil((height + yOffset)/8) * 16

在上面的代码中,这将转换为

glCompressedTexSubImage2D(GL_TEXTURE_2D, 0, 0, data.row, data.width, 8 * num_rows, GL_COMPRESSED_RGBA_ASTC_8x8, bytesPerRow * (data.row + num_rows), data.cpu_buffer.data());

Apple 设备 (imgtec) 似乎遵循我对规范的解释,我目前正在尝试发现 Mali 设备的模式。

于 2017-09-20T03:34:21.430 回答