1

当我使用 gdb 运行程序时收到此错误消息。错误显示在这一行:

long a = thread_fake(); //in file1.c

我遇到了在单独文件中定义的其他函数的问题,因此我将其简化为仅返回 0 的简单函数。该函数已定义为:

long thread_fake(){ //defined in file2.c
    return 0;
}

正如@EmployedRussian 指出的那样,程序似乎用完了堆栈。valgrind 显示以下错误:

==14711== 144 bytes in 1 blocks are possibly lost in loss record 17 of 32
==14711==    at 0x4025315: calloc (vg_replace_malloc.c:467)
==14711==    by 0x4010CD7: allocate_dtv (dl-tls.c:300)
==14711==    by 0x401146B: _dl_allocate_tls (dl-tls.c:464)
==14711==    by 0x40475C6: pthread_create@@GLIBC_2.1 (allocatestack.c:570)
==14711==    by 0x8050583: tm_main_startup 
==14711==    by 0x8048F6B: main (genome.c:201)
==14711== 144 bytes in 1 blocks are possibly lost in loss record 18 of 32
==14711==    at 0x4025315: calloc (vg_replace_malloc.c:467)
==14711==    by 0x4010CD7: allocate_dtv (dl-tls.c:300)
==14711==    by 0x401146B: _dl_allocate_tls (dl-tls.c:464)
==14711==    by 0x40475C6: pthread_create@@GLIBC_2.1 (allocatestack.c:570)
==14711==    by 0x804DFE3: thread_startup (thread.c:151)
==14711==    by 0x8048F73: main (genome.c:203)

所有创建的线程都加入了相应的 pthread_join 调用。我也尝试了 sgcheck 工具,但它在平台'x86-linux'上不起作用。请帮忙。

bt 命令的完整输出:

Program received signal SIGSEGV, Segmentation fault.
[Switching to Thread 0x406e8b70 (LWP 19416)]
sequencer_run (argPtr=0x89fce00) at sequencer.c:251
251 a = thread_fake();
(gdb) bt
#0  sequencer_run (argPtr=0x89fce00) at sequencer.c:251
#1  0x0804e306 in threadWait (argPtr=0x89dc1f4) at ../lib/thread.c:105
#2  0x4003be99 in start_thread (arg=0x406e8b70) at pthread_create.c:304
#3  0x40253cbe in clone () at ../sysdeps/unix/sysv/linux/i386/clone.S:130
4

1 回答 1

2

错误显示在这一行:

long a = thread_fake(); //in file1.c

这种情况的可能方式SIGSEGV是如果您的程序已用完堆栈。

使用 .检查 GDB 中的实际崩溃指令x/i $pc

如果指令是 aPUSH或 a CALL,那么我的猜测得到证实。

另一种可能性:您已经通过优化编译了代码,而实际的错误指令与它所归属的源代码行几乎没有关系。

更新:

是的,它会打电话call 0x804e580 <thread_fake>。有什么解决办法?

解决方案是不要用完堆栈。执行 GDBwhere命令,然后在导致崩溃的每一帧中,执行info frame并查找过大的帧。

不要在堆栈上分配太多数据,或增加堆栈大小 ( ulimit -s)。

valgrind 显示以下错误:

那是

  • 不是错误
  • 与你的问题无关

更新2:

如何检查每个帧的大小?

鉴于这种:

Stack level 0, frame at 0xffffc248:
...
Stack level 1, frame at 0xffffc250:
...
Stack level 2, frame at 0xffffc2a0:

第 1 帧的大小为8( 0xffffc250 - 0xffffc248),第 2帧的大小为 ,依此80类推。

最终更新:

原来我上面的程序没能测量出frame#0的大小,原来是……61MB!由于存在巨大的本地数组(正如 Grady Player 正确猜测的那样)。

于 2013-09-12T02:05:08.737 回答