3

我正在尝试研究 Linux 内核中的页表遍历。我使用标准方法遍历页表以查找 PFN(例如,不是实际代码):

    pgd_t *pgd; pte_t *ptep; pte_t pte; pud_t *pud; pmd_t *pmd;
    struct page *pagePtr = NULL;
    struct mm_struct *mm = current->mm;
    pgd = pgd_offset(mm, addr);
    pud = getPud(pgd, addr);
    pmd = pmd_offset(pud, addr);
    ptep = pte_offset_map(pmd, addr);
    size_t pfn = pte_pfn(pte);

该系统是

CPU:英特尔(R) 酷睿(TM) i7-3770

CPU @ 3.40GHz

操作系统:Linux Fedora release 22(二十二)内核:4.4.4-200.fc22.x86_64

我试图了解 pgd 指针如何取消引用到 pud 指针。我将简单的代码放入 getPud 函数中:

noinline pud_t *getPud(pgd_t *pgdPtr, unsigned long addr).
{
    return pud_offset(pgdPtr, addr);
}

并尝试通过objdump进行反汇编

00000000000000b0 <getPud>:
  b0:   e8 00 00 00 00          callq  b5 <getPud+0x5>
  b5:   55                      push   %rbp
  b6:   48 8b 3f                mov    (%rdi),%rdi
  b9:   48 89 e5                mov    %rsp,%rbp
  bc:   ff 14 25 00 00 00 00    callq  *0x0
  c3:   48 c1 ee 1b             shr    $0x1b,%rsi
  c7:   48 ba 00 00 00 00 00    movabs $0xffff880000000000,%rdx
  ce:   88 ff ff
  d1:   81 e6 f8 0f 00 00       and    $0xff8,%esi
  d7:   48 01 d6                add    %rdx,%rsi
  da:   48 ba 00 f0 ff ff ff    movabs $0x3ffffffff000,%rdx
  e1:   3f 00 00
  e4:   48 21 d0                and    %rdx,%rax
  e7:   48 01 f0                add    %rsi,%rax
  ea:   5d                      pop    %rbp
  eb:   c3                      retq
  ec:   0f 1f 40 00             nopl   0x0(%rax)

我的汇编知识不足以理解诸如callq *0x0

有人可以对getPud中发生的事情有所了解吗?

谢谢

谢尔盖

更新 1

我使用 objdump 来反汇编我创建的 LKM (cpes.ko) 模块以遍历页表。

>objdump -dr ./cpes.ko

./cpes.ko:     file format elf64-x86-64
Disassembly of section .text:
00000000000000b0 <getPud>:
  b0:   e8 00 00 00 00          callq  b5 <getPud+0x5>
                        b1: R_X86_64_PC32       __fentry__-0x4
  b5:   55                      push   %rbp
  b6:   48 8b 3f                mov    (%rdi),%rdi
  b9:   48 89 e5                mov    %rsp,%rbp
  bc:   ff 14 25 00 00 00 00    callq  *0x0
                        bf: R_X86_64_32S        pv_mmu_ops+0xf8
  c3:   48 c1 ee 1b             shr    $0x1b,%rsi
  c7:   48 ba 00 00 00 00 00    movabs $0xffff880000000000,%rdx
  ce:   88 ff ff
  d1:   81 e6 f8 0f 00 00       and    $0xff8,%esi
  d7:   48 01 d6                add    %rdx,%rsi
  da:   48 ba 00 f0 ff ff ff    movabs $0x3ffffffff000,%rdx
  e1:   3f 00 00
  e4:   48 21 d0                and    %rdx,%rax
  e7:   48 01 f0                add    %rsi,%rax
  ea:   5d                      pop    %rbp
  eb:   c3                      retq
  ec:   0f 1f 40 00             nopl   0x0(%rax)
4

2 回答 2

4

您正在查看 的拆卸.o,对吗?不是最终链接的二进制文件?0x0地址只是链接器将填写的占位符。(这是通过静态/全局函数指针的内存间接调用) 。pud_offset正在内联到您的函数中。

尝试objdump -dr-dR在反汇编输出中显示重定位条目。

或者更好的是,查看gcc -S输出以获取符号名称。(-fverbose-asm有时很有帮助)。找出make构建文件的命令行,并将其修改为使用-S -o-而不是-c

于 2016-03-25T09:58:35.283 回答
1

最好查一下源代码。如您所见,有一些特定于平台的 地址魔术。

于 2016-03-25T09:37:36.617 回答