5

如果使用以下命令编译一个简单的程序:

arm-none-eabi-gcc -shared -fpic -pie --specs=nosys.specs simple.c -o simple.exe

并使用以下命令打印重定位条目:

arm-none-eabi-readelf simple.exe -r

有一堆重定位条目部分(见下文)。

由于 -fpic / -pie 标志导致编译器生成与位置无关的可执行文件,因此我天真的(并且显然不正确)假设是不需要重定位表,因为加载程序可以将可执行映像放置在任何地方而不会出现问题。那么为什么那里有一个重定位表,这是否表明代码实际上不是位置独立的?

Relocation section '.rel.dyn' at offset 0x82d4 contains 37 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
000084a8  00000017 R_ARM_RELATIVE   
000084d0  00000017 R_ARM_RELATIVE   
00008508  00000017 R_ARM_RELATIVE   
00008510  00000017 R_ARM_RELATIVE   
0000855c  00000017 R_ARM_RELATIVE   
00008560  00000017 R_ARM_RELATIVE   
00008564  00000017 R_ARM_RELATIVE   
00008678  00000017 R_ARM_RELATIVE   
0000867c  00000017 R_ARM_RELATIVE   
0000870c  00000017 R_ARM_RELATIVE   
00008710  00000017 R_ARM_RELATIVE   
00008714  00000017 R_ARM_RELATIVE   
00008718  00000017 R_ARM_RELATIVE   
00008978  00000017 R_ARM_RELATIVE   
000089dc  00000017 R_ARM_RELATIVE   
000089e0  00000017 R_ARM_RELATIVE   
00008abc  00000017 R_ARM_RELATIVE   
00008ae4  00000017 R_ARM_RELATIVE   
00018af4  00000017 R_ARM_RELATIVE   
00018af8  00000017 R_ARM_RELATIVE   
00018afc  00000017 R_ARM_RELATIVE   
00018c04  00000017 R_ARM_RELATIVE   
00018c08  00000017 R_ARM_RELATIVE   
00018c0c  00000017 R_ARM_RELATIVE   
00018c34  00000017 R_ARM_RELATIVE   
00019028  00000017 R_ARM_RELATIVE   
000084cc  00000c02 R_ARM_ABS32       00000000   __libc_fini
0000850c  00000602 R_ARM_ABS32       00000000   __deregister_frame_inf
00008558  00001302 R_ARM_ABS32       00000000   __register_frame_info
00008568  00001202 R_ARM_ABS32       00000000   _Jv_RegisterClasses
00008664  00000d02 R_ARM_ABS32       00000000   __stack
00008668  00000a02 R_ARM_ABS32       00000000   hardware_init_hook
0000866c  00000802 R_ARM_ABS32       00000000   software_init_hook
00008670  00000502 R_ARM_ABS32       0001902c   __bss_start__
00008674  00000702 R_ARM_ABS32       00019048   __bss_end__
0000897c  00001402 R_ARM_ABS32       00000000   free
00008ac0  00000402 R_ARM_ABS32       00000000   malloc

Relocation section '.rel.plt' at offset 0x83fc contains 4 entries:
 Offset     Info    Type            Sym.Value  Sym. Name
00018be8  00000416 R_ARM_JUMP_SLOT   00000000   malloc
00018bec  00000616 R_ARM_JUMP_SLOT   00000000   __deregister_frame_inf
00018bf0  00001316 R_ARM_JUMP_SLOT   00000000   __register_frame_info
00018bf4  00001416 R_ARM_JUMP_SLOT   00000000   free
4

1 回答 1

5

一个可执行文件由几个部分组成。虽然实际的实施细节有所不同,但可以大致分为四组:

  1. 只读可执行代码,也称为“文本”
  2. 只读常量数据(全局常量)
  3. (已初始化)读写数据(带初始化程序的全局变量)
  4. 未初始化的读写数据(其他全局变量,初始化为0)

非位置无关代码包含大量对函数地址、全局变量和全局常量的引用。

只读数据和初始化读写数据有时包含对函数地址、全局变量和全局常量的引用:

int x;
int *y = &x; // y needs a relocation.

loader可以根据重定位来重定位代码,只有两个问题:

  1. 重定位在程序启动/库加载时需要时间
  2. 如果我们重新定位,我们现在有一个文本段的内存修改副本,这对于加载我们库的每个进程都是不同的,所以我们将浪费内存。

现在给出真正的答案:PIC 旨在通过摆脱文本重定位来解决上述问题,而不是摆脱所有重定位。

只读数据和初始化数据中的重定位相对较少,因此(1.)和(2.)通常都不是问题。对于读写数据,我们甚至不关心 (2.),因为无论如何我们都需要为每个进程单独复制一份。事实上,编译器没有办法使数据与位置无关,因为如果您要求全局int* y = &x;,那么编译器别无选择,只能将指针放在那里。

现在,如何使代码与位置无关?这取决于平台,但它通常涉及一些相对低效的操作,或者处理器对用于以与位置无关的方式访问数据和代码的更有效指令中使用的最大偏移量施加任意限制。此外,动态链接意味着某些函数的地址甚至不称为相对偏移量。因此,编译器倾向于使用包含实际地址的表,代码将从表中查找实际地址。这些表在不同平台上被称为 GOT、TOC、PLT 以及可能还有其他一些名称,它们可能是带有大量重定位的常量数据。

如果无法避免重定位,则想法是将它们全部放在一个地方以尽量减少问题 (1.) 和 (2.)。

于 2017-03-05T10:53:50.490 回答