c++ - 这是在 C++11 中将一个 std::vector 的内容移动到另一个末尾的最有效方法吗？

Question

我在想vector::insert()andstd::copy()命令需要额外的分配。但是，如果我push_back()是一个新创建的元素，那么swap()我认为这会减少任何分配，只要包含的类型不使用默认构造函数进行分配。

我的问题实际上是专门针对std::vectors 的 type std::string，但应该适用于此处所述的其他包含的类型：

template <typename T>
void appendMove(std::vector<T>& dst, std::vector<T>& src)
{
    dst.reserve(dst.size() + src.size())
    for(std::vector<T>::iterator it = src.begin(); it != src.end(); ++it)
    {
        dst.push_back(std::vector<T>());
        std::swap(dst.end()[-1], *it);
    }
}

我对么？我还缺少什么吗？也许有更好的方法来做到这一点？

score 13 · Accepted Answer

性能免责声明：使用分析。

性能考虑：

push_back如果向量的容量足以插入元素，则必须检查每个调用。编译器不太可能足够聪明地避免在循环内进行检查，也就是说，对于每次循环迭代，它都必须检查，这也可能会禁止进一步的优化。
如果之前没有调用reserve，push_back则必须随时调整向量的容量，可能在循环内多次调整，这将导致移动已经存储的元素。
swap与略有不同move：move 对移动对象的保证不那么严格，这可以进行优化
正如GManNickG在评论中指出的那样，vector::insert可以在插入之前保留必要的内存，因为它可以插入整个范围。这可能需要对随机访问迭代器进行专门化，因为std::difference它们在 O(1) 中（它可以应用于所有双向迭代器，但这可能会更慢 - 两次循环迭代 - 比不保留）。

我能想到的最有效的方法是保留必要的容量，然后在不检查容量的情况下插入元素（通过push_back或通过insert）。

一个智能标准库实现可以调用reserveinsideinsert而在插入期间不检查容量。不过，我不完全确定这是否符合 Standard。

如果你的图书馆足够聪明，Andy Prowl的版本（见评论）就足够了：

dst.insert( dst.end(),
            std::make_move_iterator(src.begin()),
            std::make_move_iterator(src.end())    );

否则，您可以在调用reserve之前手动编写调用insert，但您不能（AFAIK）插入/附加没有内部容量检查的元素：

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    dst.reserve( dst.size() + std::distance(src_begin, src_end) );
    // capacity checks might slow the loop inside `insert` down
    dst.insert(dst.end(), src_begin, src_end);
}

例子：

int main()
{
    std::vector<int> dst = { 0, 1, 2 };
    std::vector<int> src = { 3, 42 };

    append( std::make_move_iterator(src.begin()),
            std::make_move_iterator(src.end()),
            dst );
}

append为不同的迭代器类型实现可能会更好：

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst,
            std::forward_iterator_tag)
{
    // let the vector handle resizing
    dst.insert(dst.end(), src_begin, src_end);
}

template < typename T, typename RAIt >
void append(RAIt src_begin, RAIt src_end, std::vector<T>& dst,
            std::random_access_iterator_tag)
{
    dst.reserve( dst.size() + (src_end - src_begin) );
    dst.insert(dst.end(), src_begin, src_end);
}

template < typename T, typename FwdIt >
void append(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    append( src_begin, src_end, dst,
            typename std::iterator_traits<FwdIt>::iterator_category() );
}

如果由于循环内的容量检查而出现性能问题，您可以尝试首先默认构造所需的附加元素。当它们存在（即已构造）时，您可以使用未检查operator[]或简单的迭代器将 src 对象移动到它们的目的地：

template < typename T, typename RAIt >
void append(RAIt src_begin, RAIt src_end, std::vector<T>& dst,
            std::random_access_iterator_tag)
{
    auto src_size = src_end - src_begin;

    dst.resize( dst.size() + src_size );

    // copy is not required to invoke capacity checks
    std::copy( src_begin, src_end, dst.end() - src_size );
    // ^this^ should move with the example provided above
}

方便包装：

template < typename T, typename FwdIt >
void append_move(FwdIt src_begin, FwdIt src_end, std::vector<T>& dst)
{
    append( std::make_move_iterator(src_begin),
            std::make_move_iterator(src_end),
            dst );
}

c++ - 这是在 C++11 中将一个 std::vector 的内容移动到另一个末尾的最有效方法吗？

1 回答 1

Related

Reference