出于测试目的,我正在使用 Icc 内联汇编器为英特尔的 Xeon Phi 编写简短的汇编片段。现在我想使用屏蔽向量指令,但我无法将它们提供给内联汇编器。
对于这样的代码:
vmovapd -64(%%r14, %%r10), %%zmm0{%%k1}
我收到错误消息
/tmp/icpc5115IWas_.s: Assembler messages:
/tmp/icpc5115IWas_.s:563: Error: junk `%k1' after register
我尝试了很多不同的组合,但没有任何效果。Linux下编译器版本为intel64/13.1up03,使用GAS语法。
编辑:上面的代码实际上适用于非扩展汇编程序。所以这:
__asm__("vmovapd -64(%r14, %r10), %zmm0{%k1} ")
有效,而以下无效:
__asm__("vmovapd -64(%[src], %%r10), %%zmm0{%%k1} "
:
: [src]"r"(src)
:)
我想这与在扩展模式下注册名称之前使用双 % 的必要性有关。但是不,k 的单个 % 也不起作用。