我需要用一个连续的堆分配替换 3 个 std::vector 实例的 3 个堆分配,然后在这 3 个向量之间共享它。这些向量大小不会改变,所以我不需要担心在向它们推送或插入元素的情况下分配新的连续存储。我的实验结果表明,当我将这 3 个大小为n的向量替换为一个大小为 *3*n* 的向量时,对于不同的大小,我的速度提高了 2 倍。
但是,我不知道如何在不进行任何额外堆分配的情况下,从大向量中制作出更小的向量。
std::array<std::vector<double>, 3>
chunck_vector(size_t size)
{
std::vector<double> * underlying_vec = new std::vector<double>(3*size, 1.0);
// how to avoid extra heap allocations in constructor of small vectors
std::vector<double> vec0(underlying_vec->begin() , underlying_vec->begin() + size);
std::vector<double> vec1(underlying_vec->begin() + size , underlying_vec->begin() + 2*size);
std::vector<double> vec2(underlying_vec->begin() + 2*size, underlying_vec->end());
return {vec0, vec1, vec2};
}
int main(int argc, char const *argv[])
{
int size = 1000;
auto&& chunked_vecs = chunck_vector(size);
// passing each chunk to different functions
// each chunk should be responsible for managing its resources
foo0(std::get<0>(chunked_vecs));
foo1(std::get<1>(chunked_vecs));
foo2(std::get<2>(chunked_vecs));
return 0;
}
我尝试编写自己的向量类,它的构造函数接受两个迭代器,指定底层_vec存储部分的开始和结束属于该向量,但是当涉及到释放资源的工作时,这听起来不是一个干净的解决方案基础向量不再可访问并解决内存泄漏问题。
显然使用在这三个向量之间共享的自定义分配器并分配一次连续内存并将其分配给相应的向量似乎是一个更好的解决方案,但是由于我从未编写过一个,任何帮助我开始编码的提示或建议将是赞赏。