我遇到了一个很好的问题,它是相似的,但完全不一样,因为它谈到了 Java,它具有不同的哈希表实现,凭借同步的访问器 /mutators: HashMap 和 Hashtable 之间有什么区别爪哇?
set
那么和的 C++ 实现有什么区别unordered_set
呢?这个问题当然可以扩展到其他 C++ 容器的map
vsunordered_map
等等。
这是我的初步评估:
set
:虽然标准没有明确要求将其实现为树,但时间复杂性约束要求其查找/插入操作,这意味着它将始终以树的形式实现。通常作为 RB 树(如 GCC 4.8 中所见),它是高度平衡的。由于它们是高度平衡的,因此它们具有可预测的时间复杂度find()
优点:紧凑(与其他 DS 相比)
缺点:访问时间复杂度为 O(lg n)
unordered_set
:虽然标准没有明确要求将其实现为树,但时间复杂性约束要求其查找/插入操作,这意味着它将始终作为哈希表实现。
优点:
- 更快(承诺为搜索摊销 O(1))
- 与 tree-DS 相比,易于将基本原语转换为线程安全
缺点:
- 查找不保证是 O(1)。理论上最坏的情况是 O(n)。
- 不像树那么紧凑(出于实际目的,负载因子永远不会是 1)。
注意:哈希表的 O(1) 来自没有冲突的假设。即使负载因子为 0.5,每第二个变量插入都会导致碰撞。可以观察到,哈希表的负载因子与访问其中元素所需的操作数成反比。我们减少了更多#operations,更稀疏的哈希表。当存储的元素的大小与指针相当时,开销就相当大了。
我是否错过了应该知道的用于性能分析的 map/set 之间的任何区别?