来自wiki Executable and Linkable Format:
段包含文件运行时执行所必需的信息,而节包含用于链接和重定位的重要数据。整个文件中的任何字节最多只能由一个节拥有,并且可以有不属于任何节的孤儿字节。
但是section和segment有什么区别呢?在一个可执行的 ELF 文件中,一个段是否包含一个或多个部分?
但是section和segment有什么区别呢?
正是您引用的内容:段包含运行时所需的信息,而部分包含链接期间所需的信息。
一个段是否包含一个或多个部分?
一个段可以包含 0 个或多个部分。例子:
readelf -l /bin/date
Elf file type is EXEC (Executable file)
Entry point 0x402000
There are 9 program headers, starting at offset 64
Program Headers:
Type Offset VirtAddr PhysAddr
FileSiz MemSiz Flags Align
PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040
0x00000000000001f8 0x00000000000001f8 R E 8
INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238
0x000000000000001c 0x000000000000001c R 1
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000
0x000000000000d5ac 0x000000000000d5ac R E 200000
LOAD 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x0000000000000440 0x0000000000000610 RW 200000
DYNAMIC 0x000000000000de38 0x000000000060de38 0x000000000060de38
0x00000000000001a0 0x00000000000001a0 RW 8
NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254
0x0000000000000044 0x0000000000000044 R 4
GNU_EH_FRAME 0x000000000000c700 0x000000000040c700 0x000000000040c700
0x00000000000002a4 0x00000000000002a4 R 4
GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000000 0x0000000000000000 RW 8
GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x00000000000001f0 0x00000000000001f0 R 1
Section to Segment mapping:
Segment Sections...
00
01 .interp
02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss
04 .dynamic
05 .note.ABI-tag .note.gnu.build-id
06 .eh_frame_hdr
07
08 .ctors .dtors .jcr .dynamic .got
这里,PHDR
segment包含0个section,INTERP
segment包含.interp
section,第一个LOAD
segment包含一大堆section。
部分包含链接器的静态数据,OS 的段动态数据
引用是正确的,但要真正理解它的区别,您应该尝试了解节头和程序头(段)条目的字段,以及链接器(节)和操作系统(段)如何使用它们.
特别重要的信息是(除了长度):
部分:告诉链接器一个部分是否是:
.data
,.text
等。.symtab
,.srttab
.rela.text
段:告诉操作系统:
我已经写了一个教程,其中涵盖了更详细的内容:http ://www.cirosantilli.com/elf-hello-world/
一个段是否包含一个或多个部分?
是的,它是将部分放入段的链接器。
在 Binutils 中,如何将段放入段ld
中由称为链接描述文件的文本文件确定。文档:https ://sourceware.org/binutils/docs/ld/Scripts.html
您可以使用 获取默认值ld --verbose
,并使用 设置自定义值-T
。
例如,我的默认 Ubuntu 17.04 链接描述文件包含:
.text :
{
*(.text.unlikely .text.*_unlikely .text.unlikely.*)
*(.text.exit .text.exit.*)
*(.text.startup .text.startup.*)
*(.text.hot .text.hot.*)
*(.text .stub .text.* .gnu.linkonce.t.*)
}
它告诉链接器将名为.text.unlikely
, .text.*_unlikely
,.text.exit
等的部分放入.text
段中。
操作系统开发是自定义脚本有用的情况,最小示例:https ://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld
一旦可执行文件被链接,如果链接器在可执行文件中存储可选的节头,则只有可能知道哪个节去了哪个段:ELF文件中存储的“节到段映射”在哪里?
如果我错了,请纠正我,因为我不认为自己是该主题的专家,但根据我的研究,答案/评论中给出的一些陈述似乎并不完全准确。为了详细说明,我将引用句子并对其进行评论:
部分包含链接器的静态数据,OS 的段动态数据
根据这篇LWN 文章,内核仅使用 PT_INTERP、PT_LOAD 和 PT_GNU_STACK 类型的段头将可执行文件加载到内存中。但是还有其他段类型,如 PHDR、DYNAMIC、NOTE、GNU_EH_FRAME、GNU_PROPERTY、GNU_RELRO,它们被忽略了。
Afaiu,GNU_RELRO 段就像一个虚拟段;如果它存在,加载器使用它作为一个标志来使重定位数据只读。但是加载器不是操作系统的一部分,至少对于 Linux 来说是这样。
至于其他的段类型,我还没有发现它们的实际用途。它们对我来说似乎是多余的,因为相应的部分基本上具有相同或更多的信息。
因此,根据我的理解,这个答案只是一个更混乱的事实的简化近似值。
部分包含在段中
您可以拥有没有段头的 ELF 可执行文件,而可重定位 (*.o) 文件通常没有段头。此外,在接受答案的 readelf 输出中,可以看到多个段中的 .interp 部分。我没有看到任何收容限制。
段包含运行时所需的信息,而节包含链接期间所需的信息。
这似乎又是一种简化。运行时加载器(或“解释器”)还需要用于加载共享库、解析符号、执行重定位等的部分。
总而言之,虽然给出的答案可能是合理的一般近似值,但在查看细节时显然会变得更加复杂。