linux - percpu 指针在 Linux 内核中是如何实现的？

Question

在多处理器上，每个内核都可以有自己的变量。我认为它们是不同地址中的不同变量，尽管它们在同一个进程中并且具有相同的名称。

但我想知道，内核如何实现这一点？它是否会分配一块内存来存放所有 percpu 指针，并且每次将指针重定向到某个地址时都会使用 shift 或其他东西？

score 27 · Accepted Answer

正常的全局变量不是每个 CPU 的。自动变量在栈上，不同的CPU使用不同的栈，自然会得到不同的变量。

我猜您指的是 Linux 的 per-CPU 可变基础架构。
大部分魔法都在这里（asm-generic/percpu.h）：

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())

宏RELOC_HIDE(ptr, offset)只是ptr按给定的字节偏移量前进（无论指针类型如何）。

它有什么作用？

定义时，在特殊部分中创建DEFINE_PER_CPU(int, x)一个整数。__per_cpu_x.data.percpu
当内核被加载时，这个部分被加载多次——每个 CPU 一次（这部分魔法不在上面的代码中）。
__per_cpu_offset数组中填充了副本之间的距离。假设每个 cpu 数据使用 1000 字节，__per_cpu_offset[n]将包含1000*n.
在加载期间，符号per_cpu__x将被重新定位到 CPU 0 per_cpu__x。
__get_cpu_var(x)，在 CPU 3 上运行时，将转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3]). 这从 CPU 0 开始x，添加 CPU 0 的数据和 CPU 3 之间的偏移量，并最终取消引用结果指针。

linux - percpu 指针在 Linux 内核中是如何实现的？

1 回答 1

Related

Reference