5

最近,在重构会议期间,我正在查看我编写的一些代码,并注意到以下几点:

  1. 我有用于unsigned char在区间 [0-255] 中强制执行值的函数。
  2. 使用的其他函数int或带有语句的long数据类型在函数内以静默方式将值钳制在有效范围内。if
  3. 包含在类中和/或声明为具有未知upper bound但已知且明确的非负数的函数的参数的值lower bound被声明为unsigned数据类型(intlong取决于超过 4,000,000,000的可能性)。upper bound

这种不一致令人不安。这是我应该继续的好习惯吗?我应该重新考虑逻辑并坚持使用intlong使用适当的非通知钳位吗?

关于使用“适当”的注意事项:在某些情况下,我使用signed数据类型并在值超出范围时抛出通知异常,但这些是为divde by zero和保留的constructors

4

4 回答 4

6

在 C 和 C++ 中,有符号和无符号整数类型具有某些特定特征。

有符号类型的界限远非零,超出这些界限的操作具有未定义的行为(或在转换的情况下由实现定义)。

无符号类型的下限为零,上限远非零,超出这些界限的操作会悄悄地回绕。

通常,当操作超出这些界限(饱和度、发出错误信号等)时,您真正想要的是具有某些特定行为的特定值范围。有符号和无符号类型都不完全适合这种要求。混合有符号和无符号类型的操作可能会令人困惑;此类操作的规则由语言定义,但它们并不总是显而易见的。

无符号类型可能会出现问题,因为下限为零,因此具有合理值(远不及上限)的操作可能会以意想不到的方式表现。例如,这个:

for (unsigned int u = 10; u >= 0; u --) {
    // ...
}

是一个无限循环。

一种方法是对并非绝对需要无符号表示的所有内容使用有符号类型,选择足够宽的类型来保存您需要的值。这避免了有符号/无符号混合操作的问题。例如,Java 通过完全没有无符号类型来强制执行这种方法。(就个人而言,我认为这个决定有点矫枉过正,但我​​可以看到它的优势。)

另一种方法是对逻辑上不能为负的值使用无符号类型,并对可能下溢或混合有符号和无符号类型的表达式非常小心。

(还有一个是用你想要的行为来定义你自己的类型,但这有成本。)

正如 John Sallay 的回答所说,一致性可能比您采用哪种特定方法更重要。

我希望我能给出一个“这种方式是对的,那种方式是错误的”的答案,但真的没有。

于 2012-05-12T22:52:41.010 回答
3

最大的好处unsigned是它记录了值始终为正的代码。

它并不能真正为您带来任何安全感,因为超出未签名的范围通常是无意的,并且可能会导致与已签名一样多的挫败感。

我有使用 unsigned char 来强制执行区间 [0-255] 中的值的函数。

如果您依赖环绕,则使用uint8_tasunsigned char可能超过 8 位。

其他函数使用 int 或 long 数据类型以及函数内部的 if 语句以静默地将值钳制在有效范围内。

这真的是正确的行为吗?

包含在类中和/或声明为具有未知上限但已知且明确的非负下限的函数的参数的值被声明为无符号数据类型(int 或 long,具体取决于上限超过 4,000,000,000 的可能性)。

你从哪里得到 4,000,000,000 的上限?您的界限在INT_MAXand之间INT_MIN(您也可以使用std::numeric_limits. 在 C++11 中,您可以使用decltype来指定可以包装到模板/宏中的类型:

decltype(4000000000) x; // x can hold at least 4000000000
于 2012-05-12T21:41:06.737 回答
2

我可能会认为一致性是最重要的。如果您选择一种方式并正确执行,那么其他人将很容易在以后的某个时间点了解您在做什么。在正确地做这件事上,有几个问题需要考虑。

首先,检查整数变量 n 是否在有效范围内是很常见的,比如 0 到 N 来写:

if ( n > 0 && n <= N ) ...

这种比较只有在 n 有符号时才有意义。如果 n 是无符号的,那么它永远不会小于 0,因为负值会环绕。如果只是这样,您可以重写上面的内容:

if ( n <= N ) ...

如果有人不习惯看到这一点,他们可能会感到困惑并认为你做错了。

其次,我要记住,在 c++ 中不能保证整数的类型大小。因此,如果您希望某些内容以 255 为界,则 unsigned char 可能无法解决问题。如果变量具有特定含义,那么 typedef 显示该含义可能很有价值。例如,size_t 是一个与内存地址一样宽的值。这意味着您可以将它与阵列一起使用,而不必担心在 32 或 64 位机器上。我尽可能尝试使用此类 typedef,因为它们清楚地传达了我使用该类型的原因。(size_t 因为我正在访问一个数组。)

第三,回到环绕的问题。你想用无效号码发生什么。在 unsigned char 的情况下,如果您使用类型来绑定数据,那么您将无法检查是否输入了超过 255 的值。这可能是也可能不是问题。

于 2012-05-12T21:46:54.533 回答
0

这是一个主观问题,但我会给你我的看法。

就个人而言,如果没有为我尝试执行的操作指定类型,IE std::size_t 用于大小和索引,uintXX_t 用于特定位深度等......那么我默认为无符号,除非我需要使用负值。

所以这不是使用它来强制执行正值的情况,而是我必须signed明确选择特征。

除此之外,如果您担心边界,那么您需要进行自己的边界检查以确保您没有溢出。

但我说,更多时候不是你的数据类型将由你的上下文和你应用它的函数的返回类型决定。

于 2012-05-12T21:38:07.660 回答