7

我正在尝试为 Arduino Duemilanove (AVR ATmega328P ) 编写一些汇编语言 ) 编写一些汇编语言。在编译和反汇编 C 代码的同时学习汇编语言,我得到了:

(使用AVR_GCC编译)

int main() {
  volatile int a = 0;
  while (1) {
    ++a;
  }
  return 0;
}

变成

00000000 <__vectors>:
   0: 0c 94 34 00   jmp 0x68  ; 0x68 <__ctors_end>
   4: 0c 94 51 00   jmp 0xa2  ; 0xa2 <__bad_interrupt>
  ...
  64: 0c 94 51 00   jmp 0xa2  ; 0xa2 <__bad_interrupt>

00000068 <__ctors_end>:
  68: 11 24         eor r1, r1
  6a: 1f be         out 0x3f, r1  ; 63
  6c: cf ef         ldi r28, 0xFF ; 255
  6e: d8 e0         ldi r29, 0x08 ; 8
  70: de bf         out 0x3e, r29 ; 62
  72: cd bf         out 0x3d, r28 ; 61

00000074 <__do_copy_data>:
  74: 11 e0         ldi r17, 0x01 ; 1
  76: a0 e0         ldi r26, 0x00 ; 0
  78: b1 e0         ldi r27, 0x01 ; 1
  7a: e4 ec         ldi r30, 0xC4 ; 196
  7c: f0 e0         ldi r31, 0x00 ; 0
  7e: 02 c0         rjmp  .+4       ; 0x84 <__do_copy_data+0x10>
  80: 05 90         lpm r0, Z+
  82: 0d 92         st  X+, r0
  84: a0 30         cpi r26, 0x00 ; 0
  86: b1 07         cpc r27, r17
  88: d9 f7         brne  .-10      ; 0x80 <__do_copy_data+0xc>

0000008a <__do_clear_bss>:
  8a: 11 e0         ldi r17, 0x01 ; 1
  8c: a0 e0         ldi r26, 0x00 ; 0
  8e: b1 e0         ldi r27, 0x01 ; 1
  90: 01 c0         rjmp  .+2       ; 0x94 <.do_clear_bss_start>

00000092 <.do_clear_bss_loop>:
  92: 1d 92         st  X+, r1

00000094 <.do_clear_bss_start>:
  94: a0 30         cpi r26, 0x00 ; 0
  96: b1 07         cpc r27, r17
  98: e1 f7         brne  .-8       ; 0x92 <.do_clear_bss_loop>
  9a: 0e 94 53 00   call  0xa6  ; 0xa6 <main>
  9e: 0c 94 60 00   jmp 0xc0  ; 0xc0 <_exit>

000000a2 <__bad_interrupt>:
  a2: 0c 94 00 00   jmp 0 ; 0x0 <__vectors>

000000a6 <main>:
  a6: cf 93         push  r28
  a8: df 93         push  r29
  aa: 00 d0         rcall .+0       ; 0xac <main+0x6>
  ac: cd b7         in  r28, 0x3d ; 61
  ae: de b7         in  r29, 0x3e ; 62
  b0: 1a 82         std Y+2, r1 ; 0x02
  b2: 19 82         std Y+1, r1 ; 0x01
  b4: 89 81         ldd r24, Y+1  ; 0x01
  b6: 9a 81         ldd r25, Y+2  ; 0x02
  b8: 01 96         adiw  r24, 0x01 ; 1
  ba: 9a 83         std Y+2, r25  ; 0x02
  bc: 89 83         std Y+1, r24  ; 0x01
  be: fa cf         rjmp  .-12      ; 0xb4 <main+0xe>

000000c0 <_exit>:
  c0: f8 94         cli

000000c2 <__stop_program>:
  c2: ff cf         rjmp  .-2       ; 0xc2 <__stop_program>

我试图理解一些事情:

  1. .-8 或类似的语法是什么?(例如地址 0x98 或 0xAA。)
  2. 在地址 80 到 88(__do_copy_data 结尾)的行周围有一些有趣的事情。在我看来,这会将所有程序代码从地址 0xC4加载到RAM中。为什么?
  3. 在 __do_clear_bss_start/loop 中,我们通过将 RAM 中的字节设置为 0(r1 的值)来清除我们刚刚完成的所有工作。为什么?这一切终于来了main。有什么一般性的解释吗?
  4. 为什么反汇编不显示.bss、.rodata 或其他部分?
  5. 第 6a 行,为什么 SREG 被清零?不是在每条指令之后都设置为应有的状态吗?
  6. 第 6c 和 6e 行:0xFF 和 0x08 对应什么?r28 和 r29 是堆栈指针的低位和高位。
  7. 我玩了一下,添加了一个静态全局变量。为什么我们从 0x0100 而不是 0x0000 开始存储在 RAM 中?
  8. 在第 8a 行,为什么ldi r17, 1?我们以前做过(只是一句愚蠢的话)。或者其他东西可以改变r17吗?
  9. 我们开始将闪存中的程序复制到 RAM,从 0xC4 开始(我猜是 .bss 和其他部分),但是 X 的 cpi/cpc 相对于 1 将使所有闪存复制到所有 RAM 中。当 .bss 部分完成复制时,是否只是因为编译器的懒惰才停止复制?
4

2 回答 2

3

点/句点用作指示该指令的地址或位置或与之相关的东西的快捷方式。.+8 表示从这里开始加 8。您必须考虑指令集和/或汇编程序相对于指令集的细微差别。正如来自汇编器的附加信息所表明的那样,.-8 将do_clear_bss_loop返回八个字节,包括指令本身的两个字节。原始代码可能只是在那里有标签,brne do_clear_bss_loop.

很可能是在复制数据段;.text基本上是只读的。这是您的代码,它希望在这个平台上以闪存形式存在。.data但是,是读/写的,通常初始化为非零值。因此,在关闭电源的情况下,您的初始值需要保存在某个地方,例如在闪存中,但在您启动实际程序之前,引导程序需要将初始 .data 段值从闪存复制到它们在RAM中的实际位置。然后在程序运行时,它可以根据需要读取和/或修改这些值。

例如:

int x = 5;

main ()
{
    x = x + 1;
}

该值 5 必须在闪存中才能从通电开始,仅使用闪存来保存非易失性信息。但是在您可以读取/写入 x 的内存位置之前,您需要它在 RAM 中,因此一些启动代码会将所有.datasgement 内容从闪存复制到 RAM。

很抱歉,对您的问题只是猜测的内容进行了冗长的解释。

.bss是程序中初始化为零的变量。对于.data细分,如果我们有 100 个项目,我们将需要 100 个闪存。但是.bss如果我们有 100 个项目,我们只需要告诉某人有 100 个项目。我们不需要闪存中的 100 个零,只需将其编译/组装到代码中即可。

所以

int x = 5;
int y;

int main ()
{
    while(1)
    {
        y = y + x + 1;
    }
}

x是 in.data并且 5 需要在非易失性存储中。y 在.bss并且只需要在调用 main 之前归零以符合 C 标准。

当然,您自己可能没有使用全局变量,但可能有其他数据以某种方式使用.data和/或.bss段,因此引导代码在调用之前准备.data和段,以便您的 C 编程体验符合预期..bssmain()

于 2013-06-26T15:19:20.877 回答
3

我意识到这是一个迟到的答案。但是,我仍然认为对所有问题进行详细的逐点回答可能会很有趣。

  1. .-8 或类似的语法是什么?(例如地址 0x98 或 0xAA。)

这意味着:“从这里跳回 8 个字节”。请注意,程序计数器已​​经增加了指令的长度(2 个字节),因此brne .-8会在 brne 指令本身之前移动 6 个字节(不是 8 个)。同样,rcall .+0将程序计数器推送到堆栈而不改变程序流程。这是一个技巧,仅用于在单个指令中保留两个字节的堆栈空间。

  1. 在地址 80 到 88(__do_copy_data 结尾)的行周围有一些有趣的事情。在我看来,这会将所有程序代码从地址 0xC4 加载到 RAM 中。为什么?

不,没有任何内容被复制,这是一个空循环。在第 84 到 88 行,有一个测试在指针 X (r27:r26) 等于 0x0100 时退出循环。由于 X 被初始化为 0x0100,这根本不会循环。

该循环旨在将数据部分从闪存复制到 RAM。它基本上是这样的:

X = DATA_START;  // RAM address
Z = 0x00C4;      // Flash address
while (X != DATA_START + DATA_SIZE)
    ram[X++] = flash[Z++];

但是您的程序恰好有一个空的数据部分(DATA_SIZE == 0在上面的伪代码中)。

此外,您应该注意您的程序在地址 0x00c3 处结束,因此 Z 指针被初始化为指向程序代码之后。这是初始化变量的初始值所在的位置。

  1. 在 __do_clear_bss_start/loop 中,我们通过将 RAM 中的字节设置为 0(r1 的值)来清除我们刚刚完成的所有工作。为什么?这一切终于来了main。有什么一般性的解释吗?

不,什么都不会被覆盖。这个循环清除 BSS,它通常紧跟在数据部分之后,没有重叠。伪代码:

X = BSS_START;
while (X != BSS_START + BSS_SIZE)
    ram[X++] = 0;

哪里BSS_START == DATA_START + DATA_SIZE。这也是你程序中的一个空循环,因为你有一个空的 bss。

  1. 为什么反汇编不显示.bss、.rodata 或其他部分?

因为objdump -d只反汇编预期保存代码的部分。

  1. 第 6a 行,为什么 SREG 被清零?不是在每条指令之后都设置为应有的状态吗?

大多数指令只改变SREG 的一些位。此外,这会清除全局中断使能位。

  1. 第 6c 和 6e 行:0xFF 和 0x08 对应什么?r28 和 r29 是堆栈指针的低位和高位。

堆栈指针加载 0x08ff,这是 ATmega328P 中的最后一个 RAM 位置。堆栈将从那里向下增长。

  1. 我玩了一下,添加了一个静态全局变量。为什么我们从 0x0100 而不是 0x0000 开始存储在 RAM 中?

RAM 在 328P 上位于 0x0100–0x08ff。在这个地址下面有一些内存映射寄存器(CPU 寄存器和 I/O 寄存器)。详细信息请查看数据表,“8.3 SRAM 数据存储器”部分。

  1. 在第 8a 行,为什么ldi r17, 1?我们以前做过(只是一句愚蠢的话)。或者其他东西可以改变r17吗?

8a 行没用。这是因为链接器通过将不同的部分粘合在一起来构建程序的方式:__do_copy_data并且__do_clear_bss它们是独立的例程,它们不依赖于寄存器中剩下的任何其他部分。

  1. 我们开始将闪存中的程序复制到 RAM,从 0xC4(我猜是 .bss 和其他部分)开始,但是 X 的 cpi/cpc 相对于 1 将使所有闪存复制到所有 RAM 中。当 .bss 部分完成复制时,是否只是因为编译器的懒惰才停止复制?

您误解了这部分代码。只要 X 不同于 r17:0x00(即 0x0100,因为 r17 = 1),cpi、cpc 和 brne 指令就会循环。参见上面的伪代码。

于 2015-02-13T17:36:02.380 回答