0

我在一个假设的架构中,只有这些操作(Y86)。不存在算术右移。我实际上是在尝试捕获最高位以确定该数字是否为负,如果是,则将其添加到结果寄存器 rax。

编辑:

对不起,我忘了指定,我试图避免条件分支,看看它是否能提高效率。我所在的版本中不存在 cmov。

我得到的最远的是:

andq $0x10000000, elem
subq $0x01111111, elem
addq elem, %rax

但是,对于 0 的结果,这不起作用。

4

2 回答 2

1

假设您可以使用循环和条件分支:

    mov result, 0
    mov lead, 2
    mov follow, 1
1:
    mov tmp, n
    and tmp, lead
    jz 2f
    add result, follow
2:
    add follow, follow
    add lead, lead
    jnz 1b

tmp、lead 和 follow 变量必须在寄存器中。结果可以在寄存器或内存中。

于 2018-11-19T20:54:49.933 回答
1

如果 Y86 允许 MOVQ 访问不是 QWORD 对齐的内存,那么它可以完成。但我怀疑它是否会比条件分支更好。

诀窍是将数字写入内存,然后从稍微“关闭”的地址再次读取它。这有效地将位移动到 8 的倍数。addq将其与向左移动位 1 的位置相结合。

请注意,这高度依赖于处理器架构的字节序。以下示例基于 little endian(Intel 风格)。在大端上,必须调整偏移量。

(如果您更喜欢 AT&T 语法,请反转操作数并删除括号。)

movq rbx,number         ; sign bit is bit 63 of rbx
movq [address],rbx      ; sign bit is most significant bit of the byte at [address+7]
movq rbx,[address+4]    ; sign bit is bit 31 of rbx
addq rbx,rbx            ; sign bit is bit 32 of rbx
movq [address],bx       ; sign bit is least significant bit of the byte at [address+4]
movq rbx,[address+4]    ; sign bit is bit 0 of rbx
andq rbx,1              ; rbx = 0 for positive number, rbx = 1 for negative number
addq ax,bx
于 2018-11-20T17:35:37.873 回答