来自英特尔的文章:
整数格式转换通常用于成像和视频应用程序中。例如,它们可以用于在计算像素之前将 RGBA 从四个字节转换为四个浮点数。如图所示,一条 SSE4 转换指令可以执行与之前四条 SIMD 指令相同的操作。
SSE2:
pmovd xmm0, m32
pxor xmm7, xmm7
punpcklbw xmm0, xmm7
punpcklwd xmm0, xmm7
cvtdq2ps xmm0, xmm0
SSE4:
pmovzxbd xmm0, m32
cvtdq2ps xmm0, xmm0
有人可以给我看一个完整的例子吗?非常感谢!