3

ARM7 命令集提供了在汇编程序中将 32 位值右旋转任意量的有效方法。对于操作的第二个操作数,它甚至可以通过将ror #n指定为移位器操作数来“免费”,但对于 64 位整数,指令集没有直接支持。除了旋转 1、31、33 或 63 位位置的特殊情况(更不用说 0 或 32),我只知道如何使用4条指令旋转 64 位值(很简单,所以我不写在这里)。在四种特殊情况下,我可以将其减少到三个指令,但我不知道一般情况下该怎么做。所以这是我的问题:

给定两个寄存器(例如 R0 和 R1)中的 64 位值,是否可以仅使用三个ARM7 指令将该值右旋转n 个位置(对于任意n) ?

4

2 回答 2

2

如果一个寄存器(例如 r4)恰好保存了正确的魔法常数(1 左移了所需的左旋转量),我认为可以通过两条指令来完成:

  umull r3,r2,r1,r4
  典型的 r2,r3,r0,r4

比使用四个单周期指令要慢,但即使必须使用适当的常数加载 r4,它仍然比四指令方法更紧凑。

于 2011-03-29T16:17:31.510 回答
1

如果有解决方案,gcc 也无法识别:

unsigned long long int reg64 = random_value;
unsigned int n = shift_value;
reg64 = (reg64 >> (n%64)) | (reg64 << ((64-n)%64));

结果如下:

n=1:

MOVS R2, R0, LSR #1
MOV R3, R1, RRX
ORR R2, R2, R1, ASL #31

n=2-31:

MOV R2, R0, LSR #n
ORR R2, R2, R1, ASL #32-n
MOV R3, R0, ASL #32-n
ORR R3, R3, R1, LSR #n

n=33-62:

MOV R3, R0, ASL #64-n
ORR R3, R3, R1, LSR #n-32
MOV R2, R0, LSR, #n-32
ORR R2, R2, R1, ASL #64-n

n=63:

ADDS R2, R0, R0
ADC R3, R1, R1
ORR R2, R2, R1, LSR #31
于 2011-03-25T15:48:39.753 回答