问题的要点是:用户级应用程序在运行时损坏的可能性有哪些?除了硬件故障。
硬件装备:ARM9 (at91sam9xe) NAND Flash 用于:Linux 内核 + FS + 用户态应用程序。
我们有一个在 ARM9 (at91sam9xe) 上的嵌入式 linux 上运行的应用程序,几个月没有问题,但突然 ARM 报告无法执行该应用程序..
当它被执行时,它与以下转储一起崩溃:
pgd = c16b8000
[00000020] *pgd=215a0031, *pte=00000000, *ppte=00000000
Pid: 349, comm: console
CPU: 0 Not tainted (2.6.30.4-uc0 #280)
PC is at 0x4e000
LR is at 0x673e0
pc : [<0004e000>] lr : [<000673e0>] psr: 60000010
sp : bec6a728 ip : bec6acb4 fp : bec6ac9c
r10: 000bd9f8 r9 : 00000000 r8 : 00000000
r7 : 00000000 r6 : bec6acb4 r5 : 00000000 r4 : fbad2084
r3 : ffffffff r2 : bec6acb4 r1 : 00000025 r0 : 0009eab0
Flags: nZCv IRQs on FIQs on Mode USER_32 ISA ARM Segment user
Control: 0005317f Table: 216b8000 DAC: 00000015
[<c02ec3b0>] (show_regs+0x0/0x50) from [<c02f11a8>] (__do_user_fault+0x9c/0xa8)
r5:0000000b r4:c1696360
[<c02f110c>] (__do_user_fault+0x0/0xa8) from [<c02f1344>] (do_page_fault+0x114/0x244)
r7:00010000 r6:c1696360 r5:c15a62e0 r4:c1c5fde0
[<c02f1230>] (do_page_fault+0x0/0x244) from [<c02ea284>] (do_DataAbort+0x3c/0xa0)
[<c02ea248>] (do_DataAbort+0x0/0xa0) from [<c02eae00>] (ret_from_exception+0x0/0x10)
Exception stack(0xc1683fb0 to 0xc1683ff8)
3fa0: 0009eab0 00000025 bec6acb4 ffffffff
3fc0: fbad2084 00000000 bec6acb4 00000000 00000000 00000000 000bd9f8 bec6ac9c
3fe0: bec6acb4 bec6a728 000673e0 0004e000 60000010 ffffffff
我尝试 addr2line 来查看它在哪里崩溃,但它引用了 crtstuff.c =\ crtstuff.c 不是我们应用程序的一部分,我认为它与 GCC 有关。
我担心我的可执行文件损坏,所以我在 NAND 上的文件和我的 PC 上的文件上运行了一个差异......存在不应该发生的差异。另外,差异几乎都是“0x00”值,而不是它们应该包含的值。
我真正想知道的是,除了硬件故障之外,用户级应用程序如何损坏?
原因: NAND 闪存始终是可写的,所以我们假设这是一个巧合,即正在写入闪存的内容和电源熄灭。
解决方案 将我们的 FS 移动到 RAM,我们仅在需要写入内容时才将 NAND 分区的一部分挂载为可写。NAND 写保护通过硬件引脚控制,仅在有来自 App 的写请求时启用