我在一个假设的架构中,只有这些操作(Y86)。不存在算术右移。我实际上是在尝试捕获最高位以确定该数字是否为负,如果是,则将其添加到结果寄存器 rax。
编辑:
对不起,我忘了指定,我试图避免条件分支,看看它是否能提高效率。我所在的版本中不存在 cmov。
我得到的最远的是:
andq $0x10000000, elem
subq $0x01111111, elem
addq elem, %rax
但是,对于 0 的结果,这不起作用。
假设您可以使用循环和条件分支:
mov result, 0
mov lead, 2
mov follow, 1
1:
mov tmp, n
and tmp, lead
jz 2f
add result, follow
2:
add follow, follow
add lead, lead
jnz 1b
tmp、lead 和 follow 变量必须在寄存器中。结果可以在寄存器或内存中。
如果 Y86 允许 MOVQ 访问不是 QWORD 对齐的内存,那么它可以完成。但我怀疑它是否会比条件分支更好。
诀窍是将数字写入内存,然后从稍微“关闭”的地址再次读取它。这有效地将位移动到 8 的倍数。addq
将其与向左移动位 1 的位置相结合。
请注意,这高度依赖于处理器架构的字节序。以下示例基于 little endian(Intel 风格)。在大端上,必须调整偏移量。
(如果您更喜欢 AT&T 语法,请反转操作数并删除括号。)
movq rbx,number ; sign bit is bit 63 of rbx
movq [address],rbx ; sign bit is most significant bit of the byte at [address+7]
movq rbx,[address+4] ; sign bit is bit 31 of rbx
addq rbx,rbx ; sign bit is bit 32 of rbx
movq [address],bx ; sign bit is least significant bit of the byte at [address+4]
movq rbx,[address+4] ; sign bit is bit 0 of rbx
andq rbx,1 ; rbx = 0 for positive number, rbx = 1 for negative number
addq ax,bx