我试图为 gcc 提供内联汇编,以使用单个divl
指令同时获得除法和模数。不幸的是,我不擅长组装。有人可以帮我吗?谢谢你。
user405725
问问题
13881 次
5 回答
9
你正在寻找这样的东西:
__asm__("divl %2\n"
: "=d" (remainder), "=a" (quotient)
: "g" (modulus), "d" (high), "a" (low));
尽管我同意其他评论者通常 GCC 会为您执行此操作,并且您应尽可能避免内联汇编,但有时您需要此构造。
例如,如果高位字小于模数,那么像这样执行除法是安全的。然而,GCC 不够聪明,无法实现这一点,因为在一般情况下,将 64 位数字除以 32 位数字会导致溢出,因此它会调用库例程来完成额外的工作。(对于 64 位 ISA,替换为 128 位/64 位。)
于 2012-05-28T08:03:40.393 回答
8
您不应该尝试自己优化它。GCC 已经这样做了。
volatile int some_a = 18, some_b = 7;
int main(int argc, char *argv[]) {
int a = some_a, b = some_b;
printf("%d %d\n", a / b, a % b);
return 0;
}
跑步
gcc -S test.c -O
产量
main:
.LFB11:
.cfi_startproc
subq $8, %rsp
.cfi_def_cfa_offset 16
movl some_a(%rip), %esi
movl some_b(%rip), %ecx
movl %esi, %eax
movl %esi, %edx
sarl $31, %edx
idivl %ecx
movl %eax, %esi
movl $.LC0, %edi
movl $0, %eax
call printf
movl $0, %eax
addq $8, %rsp
.cfi_def_cfa_offset 8
ret
请注意,余数 %edx 没有移动,因为它也是传递给 printf 的第三个参数。
编辑:32 位版本不那么令人困惑。通过 -m32 产生
main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $16, %esp
movl some_a, %eax
movl some_b, %ecx
movl %eax, %edx
sarl $31, %edx
idivl %ecx
movl %edx, 8(%esp)
movl %eax, 4(%esp)
movl $.LC0, (%esp)
call printf
movl $0, %eax
leave
ret
于 2011-04-09T23:30:20.783 回答
5
幸运的是,您不必求助于内联汇编来实现这一点。gcc 会在可能的情况下自动执行此操作。
$ cat divmod.c
struct sdiv { unsigned long quot; unsigned long rem; };
struct sdiv divide( unsigned long num, unsigned long divisor )
{
struct sdiv x = { num / divisor, num % divisor };
return x;
}
$ gcc -O3 -std=c99 -Wall -Wextra -pedantic -S divmod.c -o -
.file "divmod.c"
.text
.p2align 4,,15
.globl divide
.type divide, @function
divide:
.LFB0:
.cfi_startproc
movq %rdi, %rax
xorl %edx, %edx
divq %rsi
ret
.cfi_endproc
.LFE0:
.size divide, .-divide
.ident "GCC: (GNU) 4.4.4 20100630 (Red Hat 4.4.4-10)"
.section .note.GNU-stack,"",@progbits
于 2011-04-09T23:32:12.473 回答
3
是的——一个 divl 将产生 eax 中的商和 edx 中的余数。使用 Intel 语法,例如:
mov eax, 17
mov ebx, 3
xor edx, edx
div ebx
; eax = 5
; edx = 2
于 2011-04-09T23:23:56.217 回答
1
这是关于 divl 的 linux 内核代码中的示例
/*
* do_div() is NOT a C function. It wants to return
* two values (the quotient and the remainder), but
* since that doesn't work very well in C, what it
* does is:
*
* - modifies the 64-bit dividend _in_place_
* - returns the 32-bit remainder
*
* This ends up being the most efficient "calling
* convention" on x86.
*/
#define do_div(n, base) \
({ \
unsigned long __upper, __low, __high, __mod, __base; \
__base = (base); \
if (__builtin_constant_p(__base) && is_power_of_2(__base)) { \
__mod = n & (__base - 1); \
n >>= ilog2(__base); \
} else { \
asm("" : "=a" (__low), "=d" (__high) : "A" (n));\
__upper = __high; \
if (__high) { \
__upper = __high % (__base); \
__high = __high / (__base); \
} \
asm("divl %2" : "=a" (__low), "=d" (__mod) \
: "rm" (__base), "0" (__low), "1" (__upper)); \
asm("" : "=A" (n) : "a" (__low), "d" (__high)); \
} \
__mod; \
})
于 2019-12-09T15:02:20.713 回答