我已经为我正在编写的一个更简单的编译器生成了代码,我想知道如何将该代码放入 ELF 文件中?
我试过使用 libelf,但我似乎无法理解如何组织表格。
我没有使用任何数据,所以我假设我需要的只是一个.text
部分。
如果我有一个生成的 x86 代码的缓冲区,我将如何创建一个只有一个.text
可以运行的简单部分的 ELF 文件?
你不能!
您正在寻找的功能实际上是称为“链接器”的构建工具的一部分。尽管除了一些未解决的符号错误之外,它不时抛出它的存在经常被忽视,它是任何构建链中最重要的组件之一。
这里有一些想法如何继续以某种方式让你的二进制文件运行。
下面描述的任何方法仅在以下情况下才有效
机器代码不包含任何带有绝对地址的跳转,因为将它们修补到正确的目的地需要重定位信息。
程序从用作输入的二进制文件的最开头开始
这应该很容易通过在文件开头的“正确”位置添加额外的(相对)跳转指令或通过使用二进制数据的偏移量来规避。
如果一个非常简单的“自包含”包含的二进制文件仅由一堆原始机器指令给出,没有任何外部依赖,也没有(!)任何绝对跳转指令而不是手动执行它可能更容易使用已经而是现有的链接器。
给定一个包含原始机器指令的文件(以下示例中的main.bin),第一步将涉及从中生成一个共享对象(示例中的main.o):
objcopy -I binary -B i386 -O elf32-i386 --rename-section .data=.text main.bin main.o
查看生成的对象符号表readelf -S
:
Symbol table '.symtab' contains 5 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 00000000 0 NOTYPE LOCAL DEFAULT UND
1: 00000000 0 SECTION LOCAL DEFAULT 1
2: 00000000 0 NOTYPE GLOBAL DEFAULT 1 _binary_main_bin_start
3: 0000000c 0 NOTYPE GLOBAL DEFAULT 1 _binary_main_bin_end
4: 0000000c 0 NOTYPE GLOBAL DEFAULT ABS _binary_main_bin_size
您会注意到符号_binary_..._start
以及根据输入文件的开始、结束和大小添加_binary_..._end
。_binary_..._size
这些可用于将可执行文件的入口点传递给链接器。
ld --entry=_binary_main_bin_start main.o -o main
应该产生你正在寻找的可执行文件。
或者,您可能希望手动创建一个仅包含必要信息的 elf 文件以获取运行的可执行文件。
如果您对 elf 格式不太熟悉,您可能需要查看规范(可在:http ://refspecs.linuxfoundation.org/ 上找到)。此外,手册页 ( man elf
) 非常详尽,因此这也可能是很好的信息来源。
为了保持最简单,我们的目标是只使用绝对必要的东西。
查看规格,您会发现在任何情况下都需要的唯一组件是 elf 标头。节头表只对共享对象是必需的,程序头表只对可执行文件是必需的。
由于我们要创建一个可执行文件,我们将只使用程序头表和一个类型的条目来PT_LOAD
描述可执行文件的整个内存布局。
为了满足对齐约束,过程映像将包含二进制文件的全部内容。(来源:man elf)。
...可加载的进程段必须具有 p_vaddr 和 p_offset 的一致值,以页面大小为模。
话虽这么说,应该很清楚为什么 elf 文件的最终布局会如下所示:
struct Binary {
Elf32_Ehdr ehdr;
Elf32_Phdr phdr;
char code[];
};
Elf32_Ehdr 和 Elf32_Phdr 的大多数字段都是固定的,因此它们已经可以在初始化程序中设置。唯一需要稍后调整的字段是描述程序头表条目中已加载段的大小(.p_filesz 和 .p_memsz)的字段。
从 stdin 获取输入并写入 stdout(因此使用 like ./a.out <main.bin >executable
)这是可以实现所述设置的方式:
#include <stdio.h>
#include <stddef.h>
#include <elf.h>
#include <string.h>
#include <stdlib.h>
#define BUFFER_SIZE 1024
char buffer[BUFFER_SIZE];
void *read_all (int *filesize) {
void *data = NULL;
int offset = 0;
int size = 0;
while ((size = fread (buffer, 1, sizeof (buffer), stdin)) > 0) {
if ((data = realloc (data, offset + size)) == NULL)
exit (-1);
memcpy (data + offset, buffer, size);
offset += size;
}
*filesize = offset;
return data;
}
#define LOAD_ADDRESS 0x8048000
struct Binary {
Elf32_Ehdr ehdr;
Elf32_Phdr phdr;
char code[];
};
int main (int argc, char *argv[]) {
void *code;
int code_size;
struct Binary binary = {
/* ELF HEADER */
.ehdr = {
/* general */
.e_ident = {
ELFMAG0, ELFMAG1, ELFMAG2, ELFMAG3,
ELFCLASS32,
ELFDATA2LSB,
EV_CURRENT,
ELFOSABI_LINUX,
},
.e_type = ET_EXEC,
.e_machine = EM_386,
.e_version = EV_CURRENT,
.e_entry = LOAD_ADDRESS + (offsetof (struct Binary, code)),
.e_phoff = offsetof (struct Binary, phdr),
.e_shoff = 0,
.e_flags = 0,
.e_ehsize = sizeof (Elf32_Ehdr),
/* program header */
.e_phentsize = sizeof (Elf32_Phdr),
.e_phnum = 1,
/* section header */
.e_shentsize = sizeof (Elf32_Shdr),
.e_shnum = 0,
.e_shstrndx = 0
},
/* PROGRAM HEADER */
.phdr = {
.p_type = PT_LOAD,
.p_offset = 0,
.p_vaddr = LOAD_ADDRESS,
.p_paddr = LOAD_ADDRESS,
.p_filesz = 0,
.p_memsz = 0,
.p_flags = PF_R | PF_X,
.p_align = 0x1000
}
};
if ((code = read_all (&code_size)) == NULL)
return -1;
/* fix program header */
binary.phdr.p_filesz = sizeof (struct Binary) + code_size;
binary.phdr.p_memsz = sizeof (struct Binary) + code_size;
/* write binary */
fwrite (&binary, sizeof (struct Binary), 1, stdout);
fwrite (code, 1, code_size, stdout);
free (code);
return 0;
}