什么更有效,为什么?
特别是_mm_loadu_si128与_mm_load_si128C 中的对比。
(编者注:或者这是被标记的程序集,可能它们的意思是movdqu与movdqa手写 asm 相比。这不是一回事,尤其是没有 AVX,因为_mm_load_si128可以编译成 ALU 指令的内存操作数,根本没有单独movdqa的。)
什么更有效,为什么?
特别是_mm_loadu_si128与_mm_load_si128C 中的对比。
(编者注:或者这是被标记的程序集,可能它们的意思是movdqu与movdqa手写 asm 相比。这不是一回事,尤其是没有 AVX,因为_mm_load_si128可以编译成 ALU 指令的内存操作数,根本没有单独movdqa的。)