我想学习lLinux内核编程。
这样做的出发点是什么?可以针对哪些更简单的问题?
**TODO** +editPic: Linux Kernel Developer -> (Ring Layer 0)
+addSection: Kernel Virtualization Engine
KERN_WARN_CODING_STYLE: Do not Loop unless you absolutely have to.
未初始化的推荐书籍
void *i
“人们只有在有一定的生命之后才能理解书籍,或者至少没有人能够理解一本深刻的书籍,直到他至少看到并经历了其中的一部分内容”。——以斯拉磅
一千码英里的旅程必须从一个步骤开始。如果您对从以下哪本书开始感到困惑,请不要担心,选择您选择的任何一本。并非所有流浪的人都迷失了。由于所有道路最终都连接到高速公路,您将在内核旅程中随着页面的进展而探索新事物,而不会遇到任何死胡同,并最终连接到code-set
. 用警觉的头脑阅读并记住:代码不是文学。
剩下的不是事物、情感、图像、心理画面、记忆甚至想法。它是一个函数。某种过程。生活的一个方面,可以被描述为“更大”事物的功能。因此,它似乎并没有真正与其他东西“分开”。就像刀的功能——切割东西——实际上并没有与刀本身分开。该功能目前可能正在使用,也可能未使用,但它可能永远不会分开。
Solovay Strassen Derandomized Algorithm for Primality Test :
阅读不要矛盾和反驳;也不相信和认为是理所当然的;也找不到谈话和话语;但要权衡和考虑。有些书是要品尝的,有些是要吞下去的,有些书是要咀嚼消化的:也就是说,有些书只能部分阅读,有些书可以阅读,但不好奇,有些书可以完整阅读,并且用勤奋和专注。
static void tasklet_hi_action(struct softirq_action *a)
{
struct tasklet_struct *list;
local_irq_disable();
list = __this_cpu_read(tasklet_hi_vec.head);
__this_cpu_write(tasklet_hi_vec.head, NULL);
__this_cpu_write(tasklet_hi_vec.tail, this_cpu_ptr(&tasklet_hi_vec.head));
local_irq_enable();
while (list) {
struct tasklet_struct *t = list;
list = list->next;
if (tasklet_trylock(t)) {
if (!atomic_read(&t->count)) {
if (!test_and_clear_bit(TASKLET_STATE_SCHED,
&t->state))
BUG();
t->func(t->data);
tasklet_unlock(t);
continue;
}
tasklet_unlock(t);
}
local_irq_disable();
t->next = NULL;
*__this_cpu_read(tasklet_hi_vec.tail) = t;
__this_cpu_write(tasklet_hi_vec.tail, &(t->next));
__raise_softirq_irqoff(HI_SOFTIRQ);
local_irq_enable();
}
}
核心 Linux ( 5 -> 1 -> 3 -> 2 -> 7 -> 4 -> 6 )
“自然无核无壳;她是一切”——约翰·沃尔夫冈·冯·歌德
读者应精通操作系统概念;公平理解长期运行的流程及其与短期执行流程的区别;容错,同时满足软硬实时约束。阅读时,了解n/ack
核心子系统中 linux 内核源代码所做的设计选择非常重要。
线程 [和] 信号 [是] 依赖于平台的痛苦、绝望、恐怖和疯狂的轨迹(~Anthony Baxte)。话虽如此,在深入内核之前,您应该是一名自我评估的 C 专家。您还应该对链表、堆栈、队列、红黑树、哈希函数等有良好的经验。
volatile int i;
int main(void)
{
int c;
for (i=0; i<3; i++) {
c = i&&&i;
printf("%d\n", c); /* find c */
}
return 0;
}
Linux Kernel 源代码的美妙之处和艺术在于它故意使用的代码混淆。这通常是必要的,以便以干净和优雅的方式传达涉及两个或多个操作的计算意义。在为多核架构编写代码时尤其如此。
#ifdef __compiler_offsetof
#define offsetof(TYPE,MEMBER) __compiler_offsetof(TYPE,MEMBER)
#else
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
#endif
Linux 设备驱动程序( 1 -> 2 -> 4 -> 3 -> 8 -> ... )
“音乐不能带你走。你必须严格按照你的能力来带它,真正专注于情感或故事的那个小内核”。——黛比·哈里
你的任务基本上是在硬件设备和软件内核之间建立一个高速通信接口。您应该阅读硬件参考数据表/手册以了解设备的行为及其控制和数据状态以及提供的物理通道。从长远来看,您的特定架构的组装知识以及对 VHDL 或 Verilog 等 VLSI 硬件描述语言的公平知识将帮助您。
问:但是,为什么我必须阅读硬件规格?
答:因为,“软件无法弥合碳和硅之间的鸿沟”——Rahul Sonnad
但是,以上对计算算法(驱动程序代码-下半部分处理)没有问题,因为它可以在通用图灵机上完全模拟。如果计算结果在数学领域成立,那么在物理领域肯定也是成立的。
Linux 设备驱动程序视频讲座(第 17 和 18 课)、嵌入式 KMS 驱动程序剖析、引脚控制和 GPIO 更新、通用时钟框架、编写真正的 Linux 驱动程序 - Greg KH
static irqreturn_t phy_interrupt(int irq, void *phy_dat)
{
struct phy_device *phydev = phy_dat;
if (PHY_HALTED == phydev->state)
return IRQ_NONE; /* It can't be ours. */
/* The MDIO bus is not allowed to be written in interrupt
* context, so we need to disable the irq here. A work
* queue will write the PHY to disable and clear the
* interrupt, and then reenable the irq line.
*/
disable_irq_nosync(irq);
atomic_inc(&phydev->irq_disable);
queue_work(system_power_efficient_wq, &phydev->phy_queue);
return IRQ_HANDLED;
}
内核网络(1 -> 2 -> 3 -> ...)
“称其为氏族,称其为网络,称其为部落,称其为家庭:无论你怎么称呼它,无论你是谁,你都需要一个。” - 简霍华德
理解内核中的数据包遍历是理解内核网络的关键。如果我们想了解 Netfilter 或 IPSec 内部结构等,必须了解它。struct sk_buff
linux内核网络层最重要的两个结构是:struct net_device
static inline int sk_hashed(const struct sock *sk)
{
return !sk_unhashed(sk);
}
内核调试( 1 -> 4 -> 9 -> ... )
除非在与它的交流中准确地说出一个意思,否则一定会导致麻烦。~艾伦·图灵,关于计算机
Brian W. Kernighan 在 Unix for Beginners (1979) 一文中说:“最有效的调试工具仍然是仔细思考,加上明智地放置打印语句”。知道要收集什么将帮助您快速获得正确的数据以进行快速诊断。伟大的计算机科学家 Edsger Dijkstra 曾经说过,测试可以证明 bug 的存在,但不能证明它们不存在。良好的调查实践应该平衡快速解决问题的需求、培养技能的需求以及有效使用主题专家的需求。
有时您会跌到谷底,似乎没有任何效果,并且您用尽了所有选择。然后才是真正的调试开始。一个错误可能会为您提供摆脱对无效解决方案的固定所需的休息时间。
内核调试和分析视频讲座,核心转储分析,使用 GDB 进行多核调试,控制多核竞争条件,调试电子设备
/* Buggy Code -- Stack frame problem
* If you require information, do not free memory containing the information
*/
char *initialize() {
char string[80];
char* ptr = string;
return ptr;
}
int main() {
char *myval = initialize();
do_something_with(myval);
}
/* “When debugging, novices insert corrective code; experts remove defective code.”
* – Richard Pattis
#if DEBUG
printk("The above can be considered as Development and Review in Industrial Practises");
#endif
*/
文件系统( 1 -> 2 -> 6 -> ... )
“我想拥有虚拟内存,至少它与文件系统相结合”。——肯·汤普森
在 UNIX 系统上,一切都是文件。如果某些东西不是文件,那么它就是一个进程,命名管道和套接字除外。在文件系统中,文件由 表示inode
,这是一种序列号,包含有关构成文件的实际数据的信息。Linux 虚拟文件系统VFS
在挂载和使用每个文件系统时将信息缓存在内存中。必须非常小心地正确更新文件系统,因为这些缓存中的数据会随着文件和目录的创建、写入和删除而被修改。这些缓存中最重要的是缓冲区缓存,它集成到各个文件系统访问其底层块存储设备的方式中。
long do_sys_open(int dfd, const char __user *filename, int flags, umode_t mode)
{
struct open_flags op;
int fd = build_open_flags(flags, mode, &op);
struct filename *tmp;
if (fd)
return fd;
tmp = getname(filename);
if (IS_ERR(tmp))
return PTR_ERR(tmp);
fd = get_unused_fd_flags(flags);
if (fd >= 0) {
struct file *f = do_filp_open(dfd, tmp, &op);
if (IS_ERR(f)) {
put_unused_fd(fd);
fd = PTR_ERR(f);
} else {
fsnotify_open(f);
fd_install(fd, f);
}
}
putname(tmp);
return fd;
}
SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, umode_t, mode)
{
if (force_o_largefile())
flags |= O_LARGEFILE;
return do_sys_open(AT_FDCWD, filename, flags, mode);
}
安全性( 1 -> 2 -> 8 -> 4 -> 3 -> ...)
“UNIX 并非旨在阻止其用户做愚蠢的事情,因为这也会阻止他们做聪明的事情”。— 道格·格温
如果不使用,任何技术都不起作用。道德随着技术而改变。
“ F × S = k ” 自由与安全的乘积是一个常数。- 尼文定律
密码学构成了在线信任的基础。黑客正在利用技术、物理或基于人的元素中的安全控制。保护内核免受其他正在运行的程序的影响是迈向安全和稳定系统的第一步,但这显然还不够:不同用户级应用程序之间还必须存在某种程度的保护。漏洞可以针对本地或远程服务。
“你无法破解你的命运,蛮力……你需要一扇后门,一条通往生活的侧通道。” ——克莱德·杜萨
计算机不解决问题,它们执行解决方案。在每一个非确定性的算法代码背后,都有一颗坚定的心。 -- /var/log/dmesg
密码学和网络安全视频讲座,安全的命名空间,远程攻击防护,安全嵌入式 Linux
env x='() { :;}; echo vulnerable' bash -c "echo this is a test for Shellsock"
内核源(0.11 -> 2.4 -> 2.6 -> 3.18)
“就像葡萄酒一样,内核编程的掌握随着时间的推移而成熟。但是,与葡萄酒不同的是,它在这个过程中变得更甜了”。——劳伦斯·穆切卡
你可能不认为程序员是艺术家,但编程是一个极富创造力的职业。这是基于逻辑的创造力。计算机科学教育不能使任何人成为专家级程序员,正如学习画笔和颜料可以使某人成为专家级画家一样。正如你已经知道的,知道路径和走路径是有区别的。卷起袖子亲手接触内核源代码至关重要。最后,有了你这样获得的核心知识,无论你走到哪里,你都会发光。
不成熟的程序员模仿;成熟的程序员偷窃;糟糕的编码员会破坏他们所接受的东西,而优秀的编码员会将其变成更好的东西,或者至少是不同的东西。优秀的编码员将他的盗窃融入到一种独特的感觉中,与被撕裂的感觉完全不同。
linux-0.11
├── boot
│ ├── bootsect.s head.s setup.s
├── fs
│ ├── bitmap.c block_dev.c buffer.c char_dev.c exec.c
│ ├── fcntl.c file_dev.c file_table.c inode.c ioctl.c
│ ├── namei.c open.c pipe.c read_write.c
│ ├── stat.c super.c truncate.c
├── include
│ ├── a.out.h const.h ctype.h errno.h fcntl.h
│ ├── signal.h stdarg.h stddef.h string.h termios.h
│ ├── time.h unistd.h utime.h
│ ├── asm
│ │ ├── io.h memory.h segment.h system.h
│ ├── linux
│ │ ├── config.h fdreg.h fs.h hdreg.h head.h
│ │ ├── kernel.h mm.h sched.h sys.h tty.h
│ ├── sys
│ │ ├── stat.h times.h types.h utsname.h wait.h
├── init
│ └── main.c
├── kernel
│ ├── asm.s exit.c fork.c mktime.c panic.c
│ ├── printk.c sched.c signal.c sys.c system_calls.s
│ ├── traps.c vsprintf.c
│ ├── blk_drv
│ │ ├── blk.h floppy.c hd.c ll_rw_blk.c ramdisk.c
│ ├── chr_drv
│ │ ├── console.c keyboard.S rs_io.s
│ │ ├── serial.c tty_io.c tty_ioctl.c
│ ├── math
│ │ ├── math_emulate.c
├── lib
│ ├── close.c ctype.c dup.c errno.c execve.c _exit.c
│ ├── malloc.c open.c setsid.c string.c wait.c write.c
├── Makefile
├── mm
│ ├── memory.c page.s
└── tools
└── build.c
Linux_source_dir/Documentation/*
尝试获取 Robert Love 关于 Linux 内核编程的书。它非常简洁易懂。
在此之后或同时,您可能想看一下“了解 Linux 内核”。但我不建议在早期阶段阅读。
另外,请查看Linux 内核编程指南。由于可以从编程内核模块中学到很多东西,因此该指南将对您有所帮助。是的,有关大量信息,请查阅内核源代码压缩包的“文档”子目录。
''我们检查 Linux 内核源代码,进行代码审查,修复未维护的代码并进行其他清理和 API 转换。这是内核黑客的良好开端。''
以下书籍我阅读并发现非常有用:
检查 kernelnewbies.org,订阅 Kernelnewbies 邮件列表,访问 irc.oftc.org #kernelnewbies
一些资源: