11

我需要一些帮助来提高我的循环缓冲区代码的效率。

我查看了stackoverflow,发现(几乎)所有关于循环缓冲区的主题都是关于这种缓冲区的使用或循环缓冲区的基本实现。我真的需要有关如何使其超级高效的信息。

计划是将此缓冲器与具有单精度 FPU 的 STM32F4 微控制器一起使用。我计划大量使用 write() 和 readn() 函数。我们实际上是在说每秒几百万次调用,所以在这里减少几个时钟周期,真的会有所作为。

我将在这里放最重要的代码,完整的缓冲区代码可通过http://dl.dropbox.com/u/39710897/circular%20buffer.rar 获得

谁能给我一些关于如何提高这个缓冲区效率的建议?

#define BUFF_SIZE 3             // buffer size set at compile time

typedef struct buffer{
    float buff[BUFF_SIZE];
    int readIndex;
    int writeIndex;
}buffer;

/********************************\
* void write(buffer* buffer, float value)
* writes value into the buffer
* @param buffer* buffer
*   pointer to buffer to be used
* @param float value
*   valueto be written in buffer
\********************************/
void write(buffer* buffer,float value){
    buffer->buff[buffer->writeIndex]=value;
    buffer->writeIndex++;
    if(buffer->writeIndex==BUFF_SIZE)
        buffer->writeIndex=0;
}

/********************************\
* float readn(buffer* buffer, int Xn)
* reads specified value from buffer
* @param buffer* buffer
*   pointer to buffer to be read from
* @param int Xn
*   specifies the value to be read from buffer counting backwards from the most recently written value
*   i.e. the most recently writen value can be read with readn(buffer, 0), the value written before that with readn(buffer, 1)
\********************************/
float readn(buffer* buffer, int Xn){
    int tempIndex;

    tempIndex=buffer->writeIndex-(Xn+1);
    while(tempIndex<0){
        tempIndex+=BUFF_SIZE;
    }

    return buffer->buff[tempIndex];
}
4

5 回答 5

15

正如“Oli Charlesworth”所建议的那样——如果你的缓冲区大小是 2 的幂,你就可以简化事情。我想写读/写函数体,这样意图就更清楚了。

#define BUFF_SIZE (4U)
#define BUFF_SIZE_MASK (BUFF_SIZE-1U)

struct buffer {
    float buff[BUFF_SIZE];
    unsigned writeIndex;
};

void write(struct buffer *buffer, float value) {
    buffer->buff[(++buffer->writeIndex) & BUFF_SIZE_MASK] = value;
}

float readn(struct buffer *buffer, unsigned Xn){
    return buffer->buff[(buffer->writeIndex - Xn) & BUFF_SIZE_MASK];
}

一些解释。请注意,根本没有分支 ( if)。我们不将数组索引限制为数组边界,而是将其与掩码进行与运算。

于 2012-03-15T11:05:46.193 回答
12

如果您可以将缓冲区大小设为 2 的幂,则可以用无条件位掩码代替对零的检查。在大多数处理器上,这应该更快。

于 2012-03-15T10:46:38.607 回答
2

这可能看起来不优雅,但很有效。通过指针访问结构元素会占用大量指令。为什么不完全删除结构并将bufferwriteIndex作为全局变量?这将大大减小你的readnwrite函数的大小。

我在 gcc 中尝试过,这是有和没有结构的输出

有结构

_write:
    pushl   %ebp
    movl    %esp, %ebp
    movl    8(%ebp), %ecx
    movl    8(%ebp), %eax
    movl    16(%eax), %edx
    movl    12(%ebp), %eax
    movl    %eax, (%ecx,%edx,4)
    movl    8(%ebp), %eax
    incl    16(%eax)
    movl    8(%ebp), %eax
    cmpl    $3, 16(%eax)
    jne L1
    movl    8(%ebp), %eax
    movl    $0, 16(%eax)
L1:
    popl    %ebp
    ret

没有结构。即制造bufferwriteIndex全球化

_write:
    pushl   %ebp
    movl    %esp, %ebp
    movl    _writeIndex, %edx
    movl    8(%ebp), %eax
    movl    %eax, _buff(,%edx,4)
    incl    _writeIndex
    cmpl    $3, _writeIndex
    jne L1
    movl    $0, _writeIndex
L1:
    popl    %ebp
    ret
于 2012-03-15T11:43:55.700 回答
2

使用指针跟踪循环缓冲区的开始和结束可能比数组索引快一点,因为如果是后者,地址将在运行时计算。尝试将 readIndex 和 writeIndexfloat*替换为。然后代码将是

*buffer->writeIndex = value;
buffer->writeIndex++;
if(buffer->writeIndex == buffer + BUFF_SIZE)
  buffer->writeIndex=buffer->buff;

buffer + BUFF_SIZE仍将是一个常量表达式,编译器将在编译时将其转换为固定地址。

于 2012-03-15T11:54:06.123 回答
1

接受的答案包含不正确的代码并将调用未定义的行为。更正如下:

#define BUFF_SIZE (4U)
#define BUFF_SIZE_MASK (BUFF_SIZE-1U)

struct buffer {
    float buff[BUFF_SIZE];
    unsigned writeIndex;
};

void write(struct buffer *buffer, float value) {
    buffer->buff[(++buffer->writeIndex) & BUFF_SIZE_MASK] = value;
}

float readn(struct buffer *buffer, unsigned Xn){
    return buffer->buff[(buffer->writeIndex - Xn) & BUFF_SIZE_MASK];
}

原始答案中的错误是假设'int'会环绕。使用带有 int 的二进制掩码也是不明智的。

于 2019-03-08T01:30:30.623 回答