我很好奇浮点运算在专用硬件与固定硬件上的速度有多快。
对于定点,假设您有数字 555,并且您想乘以 1.54,您需要将值 555、154 和 100 加载到寄存器(三个时钟)中,将 555 乘以 154(四个时钟),然后除以 100 (四个时钟),然后将输出寄存器加载到内存中(一个时钟)。
使用浮点,您可以将值 555 和 1.54 加载到寄存器(两个时钟)中,获得更大的缩放/指数(一个时钟),减去缩放(一个时钟),标准化一个(四个时钟进行乘法),乘法(四个时钟),然后将输出寄存器保存到内存中(一个时钟)。
12 个固定时钟和 13 个浮动时钟。那么我是否遗漏了一些东西,并且有真正的性能优势,还是只是易于使用?我只是使用四个时钟进行乘法,显然它不会在所有处理器上都相同,但它提供了一个总体思路。