我正在开发一个作为守护进程运行的高流量网络 C 服务器应用程序。在某些情况下,应用程序崩溃(总是没有核心)。如何使用 gdb 调试正在运行的守护程序以找到生成 SIGSEGV 的位置?
解释性说明:
我知道如何使用附加命令使用 gdb 附加到正在运行的进程
附加到进程后,它会停止。如果我运行然后“继续”,如果程序没有崩溃,gdb 将保持阻塞状态。如果我按 CTRL-C,进程将退出,我无法简单地分离 gdb。
所以问题是:有没有办法在不卡住gdb但如果进程没有崩溃时能够分离的情况下继续进程?
尝试异步模式和“ continue & ”:
将下面保存到non-stop.gdb
set target-async on
set pagination off
set non-stop on
然后运行:
$ gdb -x non-top.gdb
(gdb) !pgrep YOUR-DAEMON
1234
(gdb) attach 1234
(gdb) continue -a &
(gdb)
此页面附加/分离说该detach
命令将在gdb
.
如果要捕获应用程序中的分段错误,则必须从调试器运行应用程序。然后,当信号被捕获时,您可以使用where
或bt
查看应用程序的堆栈跟踪。应用程序出现故障后当然不能继续使用了,应该如何恢复呢?如果您希望很快触发故障,您可以附加到正在运行的进程并再次在调试器中等待故障。
如果您想要在故障发生后进行堆栈跟踪,那么您确实需要一个核心文件,因为没有进程可以附加到。现在,如果您的守护程序作为系统的一部分启动,则可能很难获得转储核心的配置,而且您可能不希望其他应用程序在所有地方留下核心转储。因此,我建议停止系统守护程序并在您的用户空间中重新启动它,然后您可以允许它转储核心。如果它作为系统的一部分启动确实很重要,那么查看守护程序的启动是否仅限于单个子 shell 并ulimit -c
在该子 shell 中使用为核心转储设置适当的最大大小.
调试应用程序的另一种方法是使用核心文件进行 GDB 调试。
要在分段发生时生成核心文件,您可以按照以下步骤操作:
1) 将以下参数复制到运行守护程序的脚本中。
ulimit -c unlimited
mkdir -p <path_to_core_file>, eg : /etc/user/ankit/corefiles
chmod 777 /etc/user/ankit/corefiles
echo "/etc/user/ankit/corefiles/%e.%s.core" > /proc/sys/kernel/core_pattern
2) 使用脚本运行您的应用程序并等待创建核心转储文件。获得核心转储后,您可以按照上述步骤使用 gdb 进行调试。
3) 使用 GDB 获取回溯
gdb -c <core_file>, where core_file is the file generated after segmentation fault
4)回溯
接下来,我们想知道程序崩溃时堆栈是什么。在 gdb 提示符下运行 bt 会给你一个回溯。如果 gdb 没有为二进制加载符号,那么它会抛出一个带有问号的错误,类似于这个“??????”。要解决此问题,您必须加载符号。
这是加载调试符号的方法。
symbol-file /path/to/binary
sharedlibrary
5) 获取所有线程的 backTrace
thread apply all bt full
注意:确保使用调试符号编译二进制文件。