1

我正在读取(以二进制格式)一个无符号 8 位整数文件,然后我需要将其转换为浮点数组。通常我会做如下的事情:

uint8_t *s1_tmp = (uint8_t *)malloc(sizeof(uint8_t)*num_elements);
float *s1 = (float *)malloc(sizeof(float)*num_elements);

fread(s1_tmp, sizeof(uint8_t), num_elements, file_id);

for(int i = 0; i < num_elements; i++){
    s1[i] = s1_tmp[i];
}

free(s1_tmp)

可以肯定的是,没有灵感,但它确实有效。然而,目前num_elements大约是 270 万,所以这个过程超级慢而且 IMO 浪费。

有没有更好的方法将 8 位整数读取为浮点数或将uint8_t数组转换为浮点数组?

4

1 回答 1

5

首先,这将因读取数据而受 I/O 限制。其次,它将受内存限制。如果您将转换与读取交错,您将获得更好的缓存性能。

选择一些合理的缓冲区大小,它足够大以获得良好的 I/O 性能,但又足够小以适合您的缓存,可能是 8-32 KB 左右。读入那么多数据,转换并重复。

例如:

#define BUFSIZE 16384
uint8_t *buffer = malloc(BUFSIZE);
float *s1 = malloc(num_elements * sizeof(float));

int total_read = 0;
int n;
while(total_read < num_elements && (n = fread(buffer, 1, BUFSIZE, file_id)) > 0)
{
    n = min(n, num_elements - total_read);
    for(int i = 0; i < n; i++)
        s1[total_read + i] = (float)buffer[i];
    total_read += n;
}
free(buffer);

您还可以通过使用 SIMD 操作一次转换多个项目来提高性能。但是,fread 的 I/O 仍然会成为总性能的瓶颈,因此您可能会从 SIMD 中看到多少改进是值得怀疑的。

由于您要转换大量uint8_t值,因此您可以通过使用查找表而不是进行整数到浮点转换来获得一些改进的性能。您只需要一个包含 256 个浮点值 (1 KB) 的查找表,它很容易放入缓存中。我不知道这是否会更快,因此您绝对应该分析代码以找出最佳选择。

于 2012-09-26T15:34:47.277 回答