4

我的印象是 std::vector 只是动态数组的一个薄包装,它们的性能应该是可比的。在 Internet 上的搜索和 stackoverflow 本身也给出了相同的答案。但是,当我自己测试时,我发现了巨大的差异。代码如下。我尝试了 VC++ 2012(发布版本)和带有优化标志 -O2 的 MinGW。

new、malloc 和 calloc 的时间大约是 0.005 秒,而 std::vector 在两个编译器上都需要 0.9 秒。std::vector 本身就很慢还是我的代码有一些严重的缺陷?

#define _SCL_SECURE 0
#include <stdio.h>
#include <stdlib.h>
#include <vector>
#include <time.h>

struct timer
{
    clock_t start;
    timer()
    {
        start=clock();
    }
    ~timer()
    {
        double t=static_cast<double>(clock()-start)/CLOCKS_PER_SEC;
        printf("%lf\n", t);
    }
};

int main()
{
    const size_t len=(1<<28);   
    {
        timer t;
        int *d=new int[len];
        printf("%d\n",d[len-1]);//prevent compiler from optimizing away 
                                //useless allocation and deallocation
        delete[] d;
    }
    {
        timer t;
        int *d=(int *)malloc(len*sizeof(int));
        printf("%d\n", d[len-1]);
        free(d);
    }

    {
        timer t;
        std::vector<int> d(len);
        printf("%d\n", d[len-1]);
    }
    {
        timer t;
        int *d=(int *)calloc(len, sizeof(int));
        printf("%d\n", d[len-1]);
        free(d);
    }

    return 0;
}

编辑 1

根据建议,我测试了创建动态数组的其他方法

  • new: 0.005
  • malloc: 0.005
  • calloc: 0.005
  • malloc+ memset: 1.244
  • vector(len): 1.231
  • vector(len, 0): 1.234
  • vector.reserve(len): 0.005

所以确实违规者是零初始化而不是分配或释放。这意味着如果需要一个零初始化数组,vector即使它有一个默认初始化所有元素的构造函数,也不是可行的方法。

此外,这不仅仅是从我脑海中蹦出来的东西。我的最后一个课程项目是根据花费的时间来评分的,我使用了几个vectors 来分配一个巨大的内存缓冲区而不是new为了异常安全,因为我们的教科书鼓励使用 STL。直到今天我才意识到我因此而失去了一些分数。不开心的一天。

编辑 2

今天我在 Ubuntu 13.04 x64 上尝试了 Clang 3.2,std::vector 不再需要那个时间来初始化。事实上,vector现在是最快的!也许这毕竟是一个编译器优化问题,而不是在 std::vector 的设计中固有的。

4

2 回答 2

4

我相信这是由于 std::vector 在每个元素上调用复制构造函数的分配,其中 malloc 只返回未初始化的内存。

std::vector<int> x(100); 

实际上与以下内容相同:

std::vector<int> y(100, int()); 

请参阅有关 std::vector 构造函数的文档 http://en.cppreference.com/w/cpp/container/vector/vector

我经常会做这样的事情:

std::vector<int> x; 
x.reserve(100);
// Insert items into x via x.push_back()
于 2013-06-27T15:45:08.583 回答
3
printf("%d\n",d[len-1]);//prevent compiler from optimizing away 

此行从未初始化的对象中读取。它没有阻止编译器优化事物,而是给了它做它想做的任何事情的余地(即程序的行为是未定义的)。

让我们假设我们以某种方式修复了这个问题,并且程序的行为现在已经明确定义(也许我们添加了一行 initialising d[len-1])。

std::vector<int> d(len);

这一行初始化len值为 0 的对象。另一行没有:

int *d=new int[len];

len产生值为 0的对象的唯一另一行是这一行:

int *d=(int *)calloc(len, sizeof(int));

您可以从与分配和释放性能相关的基准中得出的唯一结论是,该基准不适合得出与分配和释放性能相关的结论。

于 2013-06-27T15:45:20.793 回答