1

在 C++ 标准中,它提到了浮动文字:

如果缩放值不在其类型的可表示值范围内,则程序格式错误。

缩放值是有效部分乘以 10 ^ 指数部分。

在 x86-64 下:

  • float是单精度 IEEE-754
  • double是双精度 IEEE-754
  • long double是 80 位扩展精度 IEEE-754

在这种情况下,这三种类型的可代表值的范围是多少?这是在哪里记录的?或者它是如何计算的?

4

3 回答 3

4

如果您知道指数位数和尾数位数,那么根据IEEE-754 格式,可以确定最大绝对可表示值为:

2^(2^(E-1)-1)) * (1 + (2^M-1)/2^M)

最小绝对值(不包括零或非正规)是:

2^(2-2^(E-1))
  • 对于单精度,E是 8,M是 23。
  • 对于双精度,E是 11,M是 52。
  • 对于扩展精度,我不确定。如果您指的是 x87 FPU 的 80 位精度,那么据我所知,它不符合 IEEE-754 ...
于 2013-03-02T13:23:53.313 回答
2

答案(如果您使用的是具有 IEEE 浮点的机器)在float.h. FLT_MAX,DBL_MAXLDBL_MAX. 在完全支持 IEEE 的系统上,大约是 3.4e+38、1.8E+308 和 1.2E4932。(确切的值可能会有所不同,并且可能会以不同的方式表达,具体取决于编译器如何进行输入和舍入。例如,g++ 将它们定义为编译器内置函数。)

编辑:

WRT 你的问题(因为我和其他响应者都没有真正回答它):可表示值的范围是 ,其中 之一是、或。[-type_MAX...type]typeFLTDBLLDBL

于 2013-03-02T13:40:10.563 回答
-4

我一直在寻找最大的 64 位可表示数字,并最终制作了我自己的 500 位浮点计算器。如果所有 64 位都打开,这就是我想出的

18,446,744,073,709,551,615

18 千亿 446 千亿 744 万亿 730 亿 7.09 亿 55.1 万 615

于 2015-09-08T18:57:02.403 回答