c++ - 我会看到使用 std::map 而不是向量的性能提升吗>?

Question

我目前有一些我正在使用的vector代码pair<string,string>。这用于存储来自 XML 解析的一些数据，因此，该过程在某些地方非常缓慢。vector<pair<string,string> >在尝试加快整个过程方面，我想知道从切换到是否会有任何性能优势std::map<string,string>？我可以对其进行编码并运行分析器，但我想我会看看我是否能得到一个答案，首先表明一些明显的性能提升。我不需要进行任何排序，我只需将项目添加到向量中，然后在稍后阶段迭代内容并进行一些处理 - 我不需要排序或任何类似性质的东西。我猜也许我不会获得任何性能提升，但我从未真正使用过std::map之前所以我不知道没有询问或编码。

score 11 · Accepted Answer

不。如果（如您所说）您只是在集合上进行迭代，您会看到使用std::map.

映射用于通过其键访问值。如果您从不这样做，那么 map 对于容器来说是一个糟糕的选择。

score 6 · Accepted Answer

如果您不修改您的vector<pair<string,string> >- 只是一遍又一遍地迭代它 - 您将使用map. 这是因为典型map是用对象的二叉树组织的，每个对象都可以分配在不同的内存块中（除非您编写自己的分配器）。此外，每个节点都map管理指向相邻对象的指针，因此也需要时间和内存开销。但是，按键搜索是 O(log) 操作。另一方面，vector将数据保存在一个块中，因此处理器缓存通常感觉更好。在向量中搜索实际上是 O(N) 操作，不是很好但可以接受。可以使用 lower_bound 等函数将排序向量中的搜索升级到 O(log)。

这取决于您对这些数据执行的操作。如果您进行多次搜索 - 可能最好使用散列容器，unordered_map因为在此容器中按键搜索是 O(1) 操作。如前所述，迭代vector更快。

可能值得string在您的pair.

score 5 · Accepted Answer

答案取决于您对这些数据结构所做的工作以及它们的大小。如果您有数千个元素，并且您不断地反复std::vector<std::pair<std::stringm std::string> >搜索元素，则使用 a可能会提高性能（您可能要考虑将其用于此用例）。如果您的向量相对较小，并且您不经常尝试将元素插入中间，那么使用向量可能会更快。如果你只是迭代元素，向量比映射要快得多：迭代并不是它们的真正优势之一。地图擅长查找事物，假设元素的数量并不小，否则对向量的线性搜索仍然更快。firststd::map<std::string, std::string>std::unordered_map<std::string, std::string>

确定时间花在哪里的最好方法是分析代码：通常并不完全清楚时间花在哪里。通常，可疑热点实际上是没有问题的，而其他区域则显示出意想不到的性能问题。例如，您可能将您的对象传递给我的值，而不是在某个不起眼的地方通过引用。

score 1 · Accepted Answer

如果您的使用模式是在执行任何查找之前执行许多插入，那么您可能会受益于实现元素按需排序的“惰性”映射（即，当您获取迭代器、执行查找等时）。

score 0 · Accepted Answer

正如 C++ 所说std::vector的对线性内存中的项目进行排序，所以首先它分配一个具有初始容量的内存块，然后当你想将新项目插入向量时，它会检查它是否有更多空间，如果没有，它将分配一个新的缓冲区有更多空间，将所有项目复制到新缓冲区中，然后删除源缓冲区并将其设置为新缓冲区。

当您刚开始将项目插入vector其中并且有很多项目时，您会遭受过多的重新分配、复制构造和析构函数调用。

为了解决这个问题，如果你现在计算输入项（不精确，但它通常的长度），你可以reserve为向量提供一些内存并避免重新分配和所有事情。如果您不知道大小，您可以使用像std::list女巫这样的集合，永远不要重新分配其内部项目。

c++ - 我会看到使用 std::map 而不是向量的性能提升吗>?

5 回答 5

Related

Reference