7

我们目前正在为 BeagleBone Black 开发一个应用程序(使用标准的 Angstrom 发行版)。它在 GDB(由 Netbeans 远程控制)下运行了一段时间(5-10 分钟)相当愉快,但在某个相对随机的时间点会冻结 - 心跳 LED 停止闪烁,需要完全重新启动。

一种可能性是,它只是(USB)设备的数量导致了这种情况。我们通过 FTDI 串行链路连接到我的开发 PC(有一个客户端应用程序与我的 BBB 服务器通信)。有一个 4 路 FTDI 集线器,上面有多个设备(目前有 3 个),还有一个连接了另一位硬件的单个 FTDI 连接。另外,两个 I2C 设备。加上鼠标和键盘。

当然,除了传闻说是 USB 引起了问题,我没有其他证据。我的软件没有引起任何信号,日志文件告诉我的信息很少。我已经运行系统监视器应用程序来查看我是否正在泄漏内存,但它似乎表现良好且稳定(尽管 CPU 确实爬升了)。我想找到一种方法来找出失败的根源,并希望得到一些帮助。

4

2 回答 2

7

最后,兔子洞的底部:

http://e2e.ti.com/support/arm/sitara_arm/f/791/t/308549

似乎 TI 芯片中存在问题,特别是中断控制器,当 USB 过于繁忙时,会导致“乱码”中断触发。这会导致主机尝试重置,并且应用程序相应地死掉。这就解释了为什么 Angrstrom 和 Debian 都存在这个问题 - 这根本不是堆栈/驱动程序问题,而是 TI 芯片的问题。哎哟! 因此,我们可能不得不放弃 BBB 作为我们选择的平台。

调试串行控制台的输出证实了我们的应用程序的情况:

_handle_irq+0x39/0x58)
[  466.343796] [<c0008551>] (omap3_intc_handle_irq+0x39/0x58) from [<c045b95b>]
(__irq_svc+0x3b/0x5c)
[  466.359334] Exception stack(0xd2759cf8 to 0xd2759d40)
[  466.368332] 9ce0:                                                       00000000 c0849ac0
[  466.382735] 9d00: 00000000 00000000 c07a2080 00000000 d2758000 00000002 d2759db0 00000003
[  466.397178] 9d20: c0812610 d2758000 b405025a d2759d40 c0031241 c0030f4e 40000133 ffffffff
[  466.411686] [<c045b95b>] (__irq_svc+0x3b/0x5c) from [<c0030f4e>] (__do_softirq+0x46/0x174)
[  466.426346] [<c0030f4e>] (__do_softirq+0x46/0x174) from [<c0031241>] (irq_exit+0x29/0x50)
[  466.440833] [<c0031241>] (irq_exit+0x29/0x50) from [<c000c8cf>] (handle_IRQ+0x3f/0x5c)
[  466.454864] [<c000c8cf>] (handle_IRQ+0x3f/0x5c) from [<c0008551>]        (omap3_intc_handle_irq+0x39/0x58)
[  466.470777] [<c0008551>] (omap3_intc_handle_irq+0x39/0x58) from [<c045b95b>](__irq_svc+0x3b/0x5c)
[  466.486319] Exception stack(0xd2759db0 to 0xd2759df8)
[  466.495351] 9da0:                                     00000002 00000000 00007d00 00000000
[  466.509782] 9dc0: c07c81d0 c07c81d0 c07c75dc 00007d02 0000007d 00000003 c0812610 de5f4b40
[  466.524147] 9de0: 00000100 d2759df8 c0025b2d c0025bea 00000133 ffffffff
[  466.536019] [<c045b95b>] (__irq_svc+0x3b/0x5c) from [<c0025bea>] (omap3_noncore_dpll_set_rate+0x1f2/0x330)
[  466.553005] [<c0025bea>] (omap3_noncore_dpll_set_rate+0x1f2/0x330) from [<c0383273>]  (clk_change_rate+0x1b/0x52)
[  466.570813] [<c0383273>] (clk_change_rate+0x1b/0x52) from [<c03832fb>] (clk_set_rate+0x51/0x72)
[  466.586199] [<c03832fb>] (clk_set_rate+0x51/0x72) from [<c034ba29>] (cpu0_set_target+0xf9/0x198)
[  466.601754] [<c034ba29>] (cpu0_set_target+0xf9/0x198) from [<c0348c5d>] (__cpufreq_driver_target+0x4d/0x70)
[  466.618890] [<c0348c5d>] (__cpufreq_driver_target+0x4d/0x70) from [<c034b33b>] (dbs_check_cpu+0x123/0x134)
[  466.635897] [<c034b33b>] (dbs_check_cpu+0x123/0x134) from [<c034ad31>] (od_dbs_timer+0x4d/0xb0)
[  466.651283] [<c034ad31>] (od_dbs_timer+0x4d/0xb0) from [<c003c8c5>] (process_one_work+0x1b5/0x2c0)
[  466.667088] [<c003c8c5>] (process_one_work+0x1b5/0x2c0) from [<c003cca3>] (worker_thread+0x19b/0x258)
[  466.683355] [<c003cca3>] (worker_thread+0x19b/0x258) from [<c003fb8f>] (kthread+0x67/0x74)
[  466.698026] [<c003fb8f>] (kthread+0x67/0x74) from [<c000c0dd>] (ret_from_fork+0x11/0x34)
[  466.712148] drm_kms_helper: panic occurred, switching back to text console
[  407.924892] CAUTION: musb: Babble Interrupt Occurred
[  407.965570] CAUTION: musb: Babble Interrupt Occurred
[  408.026994]  gadget: high-speed config #1: Multifunction with RNDIS
[  413.918684] musb_g_ep0_irq 710: SetupEnd came in a wrong ep0stage wait
于 2014-12-10T14:38:24.547 回答
0

因此,如果集线器上有其他设备在执行 IO,则看起来将鼠标插入 USB 集线器并将其粘在 BBB 上可能会导致此问题。一位同事告诉我,Raspberry Pi 上的此类事情也存在问题。拔下鼠标后,软件运行了一个多小时,没有死机。重新插上电源,大约 10 分钟后就结冰了。取下鼠标,再次运行,又运行了半个小时,没有任何问题。

于 2014-11-27T14:18:13.897 回答