3

我使用的是这样声明的有序集:

std::set<std::pair<const std::string, const myClass *> > myset;

在对我使用的方式进行了一些分析后,set,我得出结论认为 anunordered_set将是一个更明智的选择。但是当我更改std::set为时std::unordered_set,我的编译器 (g++ 4.8.1) 收到大量错误消息,抱怨

invalid use of incomplete type struct std::hash<std::pair<const std::basic_string<char>, const myClass * > >

我发现它std::hash不知道如何处理 is 的类型std::pair,尽管构成 的两种类型pair都是可散列的。我认为整数对散列函数的错误包含有关 C++11 标准的相关信息,这些信息解释了事情出错的原因。(对于 g++ 为此发出的难以穿透的错误文本墙没有很好的解释。)

在我看来

std::hash<std::pair<T1, T2>> hasher(make_pair(x,y))
  = some_func(std::hash<T1>hasher(x), std::hash<T2>hasher(y) )

哪里some_func()可以像 XOR 一样简单(或不;请参阅为什么 XOR 是组合哈希的默认方式?

标准是否有充分的理由不需要知道如何为每个可散列类型std::hash的对象构造散列值?pair

4

1 回答 1

1

原因很简单,它没有被添加到标准中。散列其他结构(如tuple.

当事物足够好时,往往会被添加到标准中,而不是当它们完美时,因为完美是好的敌人。更多的专业化std::hash不会破坏代码(经常),所以添加新的相对无害。

无论如何,为此,我们可以编写自己的哈希扩展器。举个例子:

namespace hashers {
  constexpr size_t hash_combine( size_t, size_t ); // steal from boost, or write your own
  constexpr size_t hash_combine( size_t a ) { return a; }
  constexpr size_t hash_combine() { return 0; }
  template<class...Sizes>
  constexpr size_t hash_combine( size_t a, size_t b, Sizes... sizes ) {
    return hash_combine( hash_combine(a,b), sizes... );
  }

  template<class T=void> struct hash;

  template<class A, class B>
  constexpr size_t custom_hash( std::pair<A,B> const& p ) {
    return hash_combine( hash<size_t>{}(2), hash<std::decay_t<A>>{}(p.first), hash<std::decay_t<B>>{}(p.second) );
  }
  template<class...Ts, size_t...Is>
  constexpr size_t custom_hash( std::index_sequence<Is...>, std::tuple<Ts...> const& p ) {
    return hash_combine( hash<size_t>{}(sizeof...(Ts)), hash<std::decay_t<Ts>>{}(std::get<Is>(p))... );
  }
  template<class...Ts>
  constexpr size_t custom_hash( std::tuple<Ts...> const& p ) {
    return custom_hash( std::index_sequence_for<Ts...>{}, p );
  }
  template<class T0, class C>
  constexpr size_t custom_hash_container( size_t n, C const& c) {
    size_t retval = hash<size_t>{}(n);
    for( auto&& x : c)
      retval = hash_combine( retval, hash<T>{}(x) );
    return retval;
  }
  template<class T0, class C>
  constexpr size_t custom_hash_container( C const& c) {
    return custom_hash_container( c.size(), c );
  }
  template<class T, class...Ts>
  size_t custom_hash( std::vector<T, Ts...> const& v ) {
    return custom_hash_container<T>(v);
  }
  template<class T, class...Ts>
  size_t custom_hash( std::basic_string<T, Ts...> const& v ) {
    return custom_hash_container<T>(v);
  }
  template<class T, size_t n>
  constexpr size_t custom_hash( std::array<T, n> const& v ) {
    return custom_hash_container<T>(n, v);
  }
  template<class T, size_t n>
  constexpr size_t custom_hash( T (const& v)[n] ) {
    return custom_hash_container<T>(n, v);
  }
  // etc -- list, deque, map, unordered map, whatever you want to support
  namespace details {
    template<class T, class=void>
    struct hash : std::hash<T> {};
    using hashers::custom_hash;
    template<class T>
    struct hash<T,decltype(void(
      custom_hash(declval<T const&>())
    )) {
      constexpr size_t operator()(T const& t)const {
        return custom_hash(t);
      }
    };
  }
  template<class T>
  struct hash : details::hash<T> {};
  template<>
  struct hash<void> {
    template<class T>
    constexpr size_t operator()(T const& t)const { return hash<T>{}(t); }
  }
}

现在hashers::hash<T>将递归地使用 ADL 查找的custom_hash函数,或者std::hash如果失败,则T对其及其组件进行散列,并且hashers::hash<>是一个通用散列器,它尝试散列传递给它的任何内容。

代码可能无法编译,如图所示。

我选择散列所有容器和元组作为散列它们的长度,然后散列它们的内容组合。作为副作用,array<int, 3>哈希与 相同tuple<int,int,int>tuple<int,int>哈希与 相同pair<int,int>std::vector<char>{'a','b','c', '\0'}哈希与 相同"abc",我认为这是一个不错的属性。空数组/元组/向量/等哈希像size_t(0).

custom_hash您可以通过简单地覆盖所讨论类型的命名空间,或专门化std::hash<X>或执行您的自定义哈希来为您自己的类型扩展上述系统hashers::hash<X>(我会std::hash遵循自己最不惊讶的原则)。对于高级用途,您可以专注hashers::details::hash<X,void>于 SFINAE,但我会说这样做custom_hash

于 2015-01-14T20:48:53.790 回答