c++ - C++ std::unordered_map 复杂度

Question

我在 stackoverflow 上阅读了很多关于unordered_map (c++11) 时间复杂性的内容，但我还没有找到我的问题的答案。

让我们假设按整数索引（仅作为示例）：

Insert/at 函数持续工作（平均时间），所以这个例子需要 O(1)

std::unordered_map<int, int> mymap = {
            { 1, 1},
            { 100, 2},
            { 100000, 3 }
};

我很好奇的是遍历存储在地图中的所有（未排序的）值需要多长时间 - 例如

for ( auto it = mymap.begin(); it != mymap.end(); ++it ) { ... }

我可以假设每个存储的值只被访问一次（或两次或恒定时间）吗？这意味着遍历所有值在 N 值映射 O(N) 中。另一种可能性是我的带有键 {1,10,100000} 的示例可能需要多达 1000000 次迭代（如果由数组表示）

是否有任何其他容器可以线性迭代并通过给定键不断访问值？

我真正需要的是（伪代码）

myStructure.add(key, value) // O(1)
value = myStructure.at(key) // O(1)
for (auto key : mySructure) {...} // O(1) for each key/value pair = O(N) for N values

std::unordered_map 是我需要的结构吗？

整数索引就足够了，平均复杂度也是如此。

score 18 · Accepted Answer

不管它们是如何实现的，标准容器都提供了满足迭代器要求的迭代器。递增迭代器需要是常数时间，因此遍历任何标准容器的所有元素都是 O(N)。

score 4 · Accepted Answer

C++ 标准中规定了所有标准容器的复杂性保证。

std::unordered_map元素访问和元素插入需要具有O(1)平均复杂性和O(N)最坏情况（参见第 23.5.4.3 和 23.5.4.4 节；第 797-798 页）。

特定的实现（即标准库的特定供应商的实现）可以选择他们想要的任何数据结构。但是，要符合标准，它们的复杂性必须至少符合规定。

score 3 · Accepted Answer

有几种不同的方法可以实现哈希表，如果您有兴趣，我建议您阅读更多内容，但主要的两种方法是通过链接和开放寻址。

在第一种情况下，您有一个链表数组。数组中的每个条目都可以是空的，哈希表中的每个项目都将位于某个桶中。所以迭代是遍历数组，遍历其中的每个非空列表。显然是 O(N)，但根据链表本身的分配方式，可能内存效率非常低。

在第二种情况下，您只有一个非常大的数组，其中有很多空槽。在这里，迭代再次明显是线性的，但如果表大部分为空（这应该用于查找目的），则可能效率低下，因为实际存在的元素将位于不同的缓存行中。

无论哪种方式，您都将进行线性迭代，并且您将恰好接触每个元素一次。请注意，这也是如此，std::map那里的迭代也将是线性的。但是在地图的情况下，迭代肯定会比迭代向量的效率低得多，所以请记住这一点。如果您的用例涉及需要快速查找和快速迭代，如果您预先插入所有元素并且从不擦除，那么实际上同时拥有地图和矢量可能会好得多。为额外的性能腾出额外的空间。

c++ - C++ std::unordered_map 复杂度

3 回答 3

Related

Reference