7

我在 C 中有一个函数,它动态分配一个缓冲区,该缓冲区被传递给另一个函数来存储它的返回值。类似于以下虚拟示例:

void other_function(float in, float *out, int out_len) {
    /* Fills 'out' with 'out_len' values calculated from 'in' */
}

void function(float *data, int data_len, float *out) {
    float *buf;
    int buf_len = 2 * data_len, i;
    buf = malloc(sizeof(float) * buf_len);

    for (i = 0; i < data_len; i++, data++, out++) {
        other_function(*data, buf, buf_len);
        /* Do some other stuff with the contents of buf and write to *out */
    }
    free buf;
}

function由多维数组上的迭代器调用(准确地说,它是一个 NumPy gufunc 内核),因此它被调用数百万次,具有相同的data_len. 一遍又一遍地创建和销毁缓冲区似乎很浪费。我通常会将缓冲区的分配移动到调用的函数,function并向它传递一个指针,但我不直接控制它,所以不可能。相反,我正在考虑执行以下操作:

void function(float *data, int data_len, float *out) {
    static float *buf = NULL;
    static int buf_len = 0;
    int i;
    if (buf_len != 2 * data_len) {
        buf_len = 2 * data_len;
        buf = realloc(buf, sizeof(float) * buf_len); /* same as malloc if buf == NULL */
    }
    for (i = 0; i < data_len; i++, data++, out++) {
        other_function(*data, buf, buf_len);
        /* Do some other stuff with the contents of buf and write to *out */
    }
}

这意味着我永远不会直接释放我分配的内存:它会在后续调用中重用,然后一直停留在那里直到我的程序退出。这似乎不是正确的做法,但也不算太糟糕,因为分配的内存量总是很小。我是不是多虑了?有更好的方法吗?

4

2 回答 2

5

这种方法是合法的(但见下文),尽管像 valgrind 这样的工具会错误地将其标记为“泄漏”。(这不是泄漏,因为泄漏是内存使用量的无限增加。)您可能希望准确地对损失的时间进行基准测试,mallocfree与函数正在执行的其他操作进行比较。

如果您可以使用 C99 或 gcc,并且您的缓冲区不是太大,您还应该考虑可变长度数组,它与静态缓冲区一样快(或快于),并且不会产生碎片。如果您在另一个编译器上,您可以查看非标准(但广泛 支持)alloca 扩展。

您确实需要知道使用静态缓冲区使您的功能:

  1. 线程不安全 - 如果同时从多个线程调用它,它将破坏另一个实例的数据。如果从 numpy 调用 Python,这可能不是问题,因为 GIL 将有效地序列化线程。

  2. 不可重入 - 如果other_function调用一些 Python 代码最终调用function- 无论出于何种原因 - 在function完成之前,您的函数将再次破坏自己的数据。

如果您不需要真正的并行执行和重入,那么使用static变量就可以了,而且很多 C 代码都以这种方式使用它们。

于 2013-08-22T21:22:45.177 回答
2

这是一种很好的方法,许多库内部可能会使用类似的方法。程序退出时内存会自动释放。

您可能希望四舍五入buf_len到某个块大小的倍数,因此您不会realloc()每次都data_len更改一点点。但是,如果data_len几乎总是相同的大小,则没有必要。

于 2013-08-22T21:19:45.057 回答