背景
很长一段时间以来,gcc 一直提供许多内置的位旋转函数,特别是尾随和前导 0 位的数量(也用于long unsigned
and long long unsigned
,后缀为l
and ll
):
— 内置功能:
int __builtin_clz (unsigned int x)
返回 中前导 0 位的数量
x
,从最高有效位位置开始。如果x
为 0,则结果未定义。— 内置功能:
int __builtin_ctz (unsigned int x)
返回 中尾随 0 位的数量
x
,从最低有效位位置开始。如果x
为 0,则结果未定义。
然而,在我测试的每个在线(免责声明:仅限 x64)编译器上,结果都是两者都clz(0)
返回ctz(0)
底层内置类型的位数,例如
#include <iostream>
#include <limits>
int main()
{
// prints 32 32 32 on most systems
std::cout << std::numeric_limits<unsigned>::digits << " " << __builtin_ctz(0) << " " << __builtin_clz(0);
}
尝试的解决方法
最新的 Clang SVN 主干std=c++1y
模式使所有这些函数都放松了 C++14 constexpr
,这使得它们可以在 SFINAE 表达式中使用,用于围绕 3 ctz
/clz
内置函数的包装函数模板unsigned
,unsigned long
和unsigned long long
template<class T> // wrapper class specialized for u, ul, ull (not shown)
constexpr int ctznz(T x) { return wrapper_class_around_builtin_ctz<T>()(x); }
// overload for platforms where ctznz returns size of underlying type
template<class T>
constexpr auto ctz(T x)
-> typename std::enable_if<ctznz(0) == std::numeric_limits<T>::digits, int>::type
{ return ctznz(x); }
// overload for platforms where ctznz does something else
template<class T>
constexpr auto ctz(T x)
-> typename std::enable_if<ctznz(0) != std::numeric_limits<T>::digits, int>::type
{ return x ? ctznz(x) : std::numeric_limits<T>::digits; }
这个 hack 的好处是,提供所需结果的平台ctz(0)
可以省略一个额外的条件来测试x==0
(这似乎是一个微优化,但是当你已经降到内置位旋转函数的水平时,它可以使差别很大)
问题
内置函数系列clz(0)
和的未定义程度如何ctz(0)
?
- 他们可以抛出
std::invalid_argument
异常吗? - 对于 x64,它们对于当前的 gcc 发行版会返回底层类型的大小吗?
- ARM/x86 平台有什么不同吗(我无权测试这些平台)?
- 上述 SFINAE 技巧是分离此类平台的明确方法吗?