13

我想从核心文件分析中分析内存泄漏。

我已经编写了示例代码来注入内存泄漏并使用 gcore 命令生成核心文件。

#include <stdlib.h>
#include <unistd.h>
void fun()
{
  int *ptr = new int(1234);
}
int main()
{
  int i=0;
  while(i++<2500)
  {
    fun();
}
sleep(360);
return 0;
}

查找进程 ID

ayadav@ajay-PC:~$ ps -aef |grep over  
ajay      8735  6016  0 12:57 pts/2    00:00:00 ./over  
ayadav    8739  4659  0 12:57 pts/10   00:00:00 grep over  

并生成核心

ayadav@ajay-PC:~$ sudo gcore 8735
[sudo] password for ayadav:
0x00007fbb7dda99a0 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:81
81      ../sysdeps/unix/syscall-template.S: No such file or directory.
Saved corefile core.8735

我从核心文件中找到了如下常见模式(如stackoverflow上的建议另一个线程有没有办法找到进程的哪个部分使用了大部分内存,只查看生成的核心文件?

ayadav@ajay-PC:~$ hexdump core.6015 | awk '{printf "%s%s%s%s\n%s%s%s%s\n", $5,$4,$3,$2,$9,$8,$7,$6}' | sort | uniq -c | sort -nr | head
6913 0000000000000000  
2503 0000002100000000  
2501 000004d200000000  
786 0000000000007ffc  
464  
125 1ccbc4d000007ffc  
 92 1ca7ead000000000  
 91 0000000200007ffc  
 89 0000000100007ffc  
 80 0000000100000000  

下面两个地址疑似一个

2503 0000002100000000  
2501 000004d200000000  

核心文件具有以下重复模式

0003560 0000 0000 0021 0000 0000 0000 04d2 0000  
0003570 0000 0000 0000 0000 0000 0000 0000 0000  
0003580 0000 0000 0021 0000 0000 0000 04d2 0000  
0003590 0000 0000 0000 0000 0000 0000 0000 0000  
00035a0 0000 0000 0021 0000 0000 0000 04d2 0000  
00035b0 0000 0000 0000 0000 0000 0000 0000 0000  
00035c0 0000 0000 0021 0000 0000 0000 04d2 0000  
00035d0 0000 0000 0000 0000 0000 0000 0000 0000  
00035e0 0000 0000 0021 0000 0000 0000 04d2 0000  
00035f0 0000 0000 0000 0000 0000 0000 0000 0000  
0003600 0000 0000 0021 0000 0000 0000 04d2 0000  
0003610 0000 0000 0000 0000 0000 0000 0000 0000  
0003620 0000 0000 0021 0000 0000 0000 04d2 0000  
0003630 0000 0000 0000 0000 0000 0000 0000 0000  
0003640 0000 0000 0021 0000 0000 0000 04d2 0000

但我不太清楚如何从 gdb info address 或 x 之类的命令访问它。谁能告诉我如何将符号信息从二进制格式转换?

4

2 回答 2

12

1 - 可以使用核心转储评估内存泄漏。我采取了一个示例 C++ 示例:

class Base  
{  
public:  
    virtual void fun(){}  
    virtual void xyz(){}  
    virtual void lmv(){}  
    virtual void abc(){}  
};  

class Derived: public Base  
{  
public:  
    void fun(){}  
    void xyz(){}  
    void lmv(){}  
    void abc(){}  
};  

void fun()  
{  
    Base *obj  = new Derived();  
}  
int main()  
{  
    for(int i = 0; i < 2500;i++)
    {
        fun();
    }
    sleep(3600);
    return 0; 
}

2 - 使用 gcore 命令创建核心

3 - 从核心文件中搜索重复模式。

ayadav@ajay-PC:~$ hexdump core.10639 | awk '{printf "%s%s%s%s\n%s%s%s%s\n", $5,$4,$3,$2,$9,$8,$7,$6}' | sort | uniq -c | sort -nr  | head
   6685 0000000000000000  
   2502 0000002100000000  
   2500 004008d000000000  
    726 0000000000007eff  
    502   
    125 2e4314d000007eff  
     93 006010d000000000  
     81 0000000100007eff  
     80 0000000100000000  
     73 0000000000000001  

0000002100000000并且004008d000000000 是重复的模式

4 - 检查每个qword是什么?

(gdb) info symbol ...
(gdb) x ...

例子:

(gdb) info symbol 0x4008d000
No symbol matches 0x4008d000.
(gdb) info symbol 0x4008d0
vtable for Derived + 16 in section .rodata of /home/ayadav/virtual

5 - 可能最常见的 vtable 必须与内存泄漏有关,即 Derived vtable。

注意:我同意 coredump 分析不是查找内存泄漏的最佳实践。可以使用不同的静态和动态工具(如 valgrind 等)找到内存泄漏。

于 2014-12-24T08:08:41.320 回答
3

我认为没有办法确定进程是否导致内存泄漏或不直接查看核心转储。事实上,没有所谓的内存泄漏,我们不能在不知道程序员编写代码的意图的情况下发表评论。话虽如此,您可以通过查看核心转储的大小来了解。您可以生成多个转储,例如,一个在初始运行后,一个在长时间运行后,如果您看到大小差异很大,可以猜测可能出现问题。但同样,内存可以用于生产目的。

对于内存泄漏的实际分析和跟踪,应该使用 memtrack、valgrind 等工具在 malloc 和 free 上添加包装器,以提供有关每个 alloc 和 free 的额外信息。

更新:

当您正在寻找十六进制分析时,我可以看到以下内容:您的每一行都是 16 个字节,并在两行中​​重复。即一个块 32 个字节。0x4D2 是十进制的 1234。所以,你的数据就在那里。您的一个分配块可能是 32 个字节。在每个 'new()' 之后检查并打印十六进制地址,并比较以查看您是否观察到 32 个字节的间隙,然后对其进行解释。

于 2014-12-22T09:56:53.413 回答