19

我正在 Linux x86_64 上试验 ELF 可执行文件和 gnu 工具链:

我已经链接并(手动)剥离了“Hello World”测试:

        .global _start
        .text
_start:
        mov     $1, %rax
        ...

变成一个 267 字节的 ELF64 可执行文件...

0000000: 7f45 4c46 0201 0100 0000 0000 0000 0000  .ELF............
0000010: 0200 3e00 0100 0000 d400 4000 0000 0000  ..>.......@.....
0000020: 4000 0000 0000 0000 0000 0000 0000 0000  @...............
0000030: 0000 0000 4000 3800 0100 4000 0000 0000  ....@.8...@.....
0000040: 0100 0000 0500 0000 0000 0000 0000 0000  ................
0000050: 0000 4000 0000 0000 0000 4000 0000 0000  ..@.......@.....
0000060: 0b01 0000 0000 0000 0b01 0000 0000 0000  ................
0000070: 0000 2000 0000 0000 0000 0000 0000 0000  .. .............
0000080: 0000 0000 0000 0000 0000 0000 0000 0000  ................
0000090: 0000 0000 0000 0000 0000 0000 0000 0000  ................
00000a0: 0000 0000 0000 0000 0000 0000 0000 0000  ................
00000b0: 0400 0000 1400 0000 0300 0000 474e 5500  ............GNU.
00000c0: c3b0 cbbd 0abf a73c 26ef e960 fc64 4026  .......<&..`.d@&
00000d0: e242 8bc7 48c7 c001 0000 0048 c7c7 0100  .B..H......H....
00000e0: 0000 48c7 c6fe 0040 0048 c7c2 0d00 0000  ..H....@.H......
00000f0: 0f05 48c7 c03c 0000 0048 31ff 0f05 4865  ..H..<...H1...He
0000100: 6c6c 6f2c 2057 6f72 6c64 0a              llo, World.

它有一个程序头 (LOAD) 并且没有节:

There are 1 program headers, starting at offset 64

Program Headers:
  Type           Offset             VirtAddr           PhysAddr
                 FileSiz            MemSiz              Flags  Align
  LOAD           0x0000000000000000 0x0000000000400000 0x0000000000400000
                 0x000000000000010b 0x000000000000010b  R E    200000

这似乎在地址 0x400000 处加载整个文件(文件偏移量 0 到 0x10b - elf 标头和所有文件)。

入口点是:

 Entry point address:               0x4000d4

对应于文件中的 0xd4 偏移量,我们可以看到该地址是机器码的开始(mov $1, %rax1

我的问题是 gnu 链接器为什么(如何)选择0x400000将文件映射到的地址?

4

2 回答 2

11

起始地址通常由链接描述文件设置。

例如,在 GNU/Linux 上,/usr/lib/ldscripts/elf_x86_64.x我们看到:

...
PROVIDE (__executable_start = SEGMENT_START("text-segment", 0x400000)); \
    . = SEGMENT_START("text-segment", 0x400000) + SIZEOF_HEADERS;

该值是该平台上函数0x400000的默认值。SEGMENT_START()

您可以通过浏览链接器手册了解有关链接器脚本的更多信息:

% info ld Scripts
于 2013-01-14T11:46:26.783 回答
1

任务的虚拟地址空间的页面零保持未映射,因此可以通过导致 SIGSEGV 的页面错误异常捕获空指针引用。4 MB 适合“大页面”粒度(与“普通页面”粒度 4 KB 相对) - 以 4 MB 页面粒度的设置,0x000000 到 0x3FFFFF 地址范围未映射,使 0x400000 成为任务虚拟地址空间中的第一个有效地址.

于 2020-11-26T09:17:28.580 回答