10

我在想vector::insert()andstd::copy()命令需要额外的分配。但是,如果我push_back()是一个新创建的元素,那么swap()我认为这会减少任何分配,只要包含的类型不使用默认构造函数进行分配。

我的问题实际上是专门针对std::vectors 的 type std::string,但应该适用于此处所述的其他包含的类型:

template <typename T>
void appendMove(std::vector<T>& dst, std::vector<T>& src)
{
    dst.reserve(dst.size() + src.size())
    for(std::vector<T>::iterator it = src.begin(); it != src.end(); ++it)
    {
        dst.push_back(std::vector<T>());
        std::swap(dst.end()[-1], *it);
    }
}

我对么?我还缺少什么吗?也许有更好的方法来做到这一点?

4

1 回答 1

13

性能免责声明:使用分析。

性能考虑:

  • push_back如果向量的容量足以插入元素,则必须检查每个调用。编译器不太可能足够聪明地避免在循环内进行检查,也就是说,对于每次循环迭代,它都必须检查,这也可能会禁止进一步的优化。
  • 如果之前没有调用reservepush_back则必须随时调整向量的容量,可能在循环内多次调整,这将导致移动已经存储的元素。
  • swap与 略有不同move:move 对移动对象的保证不那么严格,这可以进行优化
  • 正如GManNickG在评论中指出的那样,vector::insert可以在插入之前保留必要的内存,因为它可以插入整个范围。这可能需要对随机访问迭代器进行专门化,因为std::difference它们在 O(1) 中(它可以应用于所有双向迭代器,但这可能会更慢 - 两次循环迭代 - 比保留)。

我能想到的最有效的方法是保留必要的容量,然后在不检查容量的情况下插入元素(通过push_back或通过insert)。

一个智能标准库实现可以调用reserveinsideinsert而在插入期间不检查容量。不过,我不完全确定这是否符合 Standard

如果你的图书馆足够聪明,Andy Prowl的版本(见评论)就足够了:

dst.insert( dst.end(),
            std::make_move_iterator(src.begin()),
            std::make_move_iterator(src.end())    );

否则,您可以在调用reserve之前手动编写调用insert,但您不能(AFAIK)插入/附加没有内部容量检查的元素:

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    dst.reserve( dst.size() + std::distance(src_begin, src_end) );
    // capacity checks might slow the loop inside `insert` down
    dst.insert(dst.end(), src_begin, src_end);
}

例子:

int main()
{
    std::vector<int> dst = { 0, 1, 2 };
    std::vector<int> src = { 3, 42 };

    append( std::make_move_iterator(src.begin()),
            std::make_move_iterator(src.end()),
            dst );
}

append为不同的迭代器类型实现可能会更好:

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst,
            std::forward_iterator_tag)
{
    // let the vector handle resizing
    dst.insert(dst.end(), src_begin, src_end);
}

template < typename T, typename RAIt >
void append(RAIt src_begin, RAIt src_end, std::vector<T>& dst,
            std::random_access_iterator_tag)
{
    dst.reserve( dst.size() + (src_end - src_begin) );
    dst.insert(dst.end(), src_begin, src_end);
}

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    append( src_begin, src_end, dst,
            typename std::iterator_traits<FwdIt>::iterator_category() );
}

如果由于循环内的容量检查而出现性能问题,您可以尝试首先默认构造所需的附加元素。当它们存在(即已构造)时,您可以使用未检查operator[]或简单的迭代器将 src 对象移动到它们的目的地:

template < typename T, typename RAIt >
void append(RAIt src_begin, RAIt src_end, std::vector<T>& dst,
            std::random_access_iterator_tag)
{
    auto src_size = src_end - src_begin;

    dst.resize( dst.size() + src_size );

    // copy is not required to invoke capacity checks
    std::copy( src_begin, src_end, dst.end() - src_size );
    // ^this^ should move with the example provided above
}

方便包装:

template < typename T, typename FwdIt >
void append_move(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    append( std::make_move_iterator(src_begin),
            std::make_move_iterator(src_end),
            dst );
}
于 2013-05-16T23:43:35.483 回答