什么更有效,为什么?
特别是_mm_loadu_si128
与_mm_load_si128
C 中的对比。
(编者注:或者这是被标记的程序集,可能它们的意思是movdqu
与movdqa
手写 asm 相比。这不是一回事,尤其是没有 AVX,因为_mm_load_si128
可以编译成 ALU 指令的内存操作数,根本没有单独movdqa
的。)
什么更有效,为什么?
特别是_mm_loadu_si128
与_mm_load_si128
C 中的对比。
(编者注:或者这是被标记的程序集,可能它们的意思是movdqu
与movdqa
手写 asm 相比。这不是一回事,尤其是没有 AVX,因为_mm_load_si128
可以编译成 ALU 指令的内存操作数,根本没有单独movdqa
的。)