4

你可能已经读过这个问题: 如何让性能在我的程序中找到符号

1)我的问题是:

当我使用 perf report 时,它会给出如下结果:

    # Overhead  Command      Shared Object                    Symbol
    #   .  .  
    #
        99.59%     test  test               [.] 0x000003d4          
         0.21%     test  [kernel.kallsyms]  [k] __do_fault          
         0.10%     test  [kernel.kallsyms]  [k] run_timer_softirq   
         0.10%     test  [kernel.kallsyms]  [k] __update_cpu_load   
         0.01%     test  [kernel.kallsyms]  [k] set_task_comm       
         0.00%     test  [kernel.kallsyms]  [k] intel_pmu_enable_all

即:性能可以在内核中找到符号,但在我的程序中找不到符号。

我的程序在这里:

     void longa() 
      { 
         int i,j; 
         for(i = 0; i < 1000000; i++) 
        j=i; //am I silly or crazy? I feel boring and desperate. 
      } 


     void foo2() 
     { 
       int i; 
       for(i=0 ; i < 10; i++) 
        longa(); 
     } 

     void foo1() 
     { 
       int i; 
       for(i = 0; i< 100; i++) 
          longa(); 
     } 

    int main(void) 
     { 
       foo1(); 
       foo2(); 
     } 

2)我已经编译了这样的程序:

gcc test.c -g -o 测试

我的环境:操作系统:ubuntu 内核:3.10.9

4

4 回答 4

5

今天,我跑步时perf test,收到一条消息说vmlinux symtab matches kallsyms: Failed

在找原因的时候,发现原因是 的值/proc/sys/kernel/kptr_restrict是1。当我们把它设置为 时0,就会在我们的程序中得到这个符号。

于 2013-10-29T14:39:59.253 回答
2

有 2 个可能的问题来源:

  • 您的perf工具是在没有elfutils支持的情况下编译的。
  • 您的perf工具在您的目标上找不到libelf.so库。
于 2014-08-06T08:34:58.567 回答
1

我遇到了同样的问题,发现原因是我的perf的矮人功能没有打开。

一个简单的解决方案是重新编译perf

% sudo apt-get install libdw-dev
% cd /path/to/perf/source/
% sudo make
% sudo make install

这使perf能够找到所有符号!

如果它仍然不适合您,请参阅此链接, 如何编译具有所有功能的 Linux perf 工具

于 2017-04-25T07:17:07.963 回答
0

嗯,我刚试过这个,对我来说它可以正常工作,afaik。环境是 ubuntu 13.04(使用 gcc 4.7.3)。

如果它仍然不适合您,您可能需要检查调试符号是否正常,比如 gdb。

 % gcc test.c -g -o test
XXX@YYY
 % perf record ./test
[ perf record: Woken up 1 times to write data ]
[ perf record: Captured and wrote 0.060 MB perf.data (~2620 samples) ]
XXX@YYY
 % perf report --stdio
# ========
# captured on: Wed Oct 16 11:58:40 2013
# hostname : sundberg-office-antec
# os release : 3.8.0-31-generic
# perf version : 3.8.13.8
# arch : x86_64
# nrcpus online : 2
# nrcpus avail : 2
# cpudesc : AMD Phenom(tm) II X2 555 Processor
# cpuid : AuthenticAMD,16,4,3
# total memory : 16434276 kB
# cmdline : /usr/bin/perf_3.8.0-31 record ./test 
# event : name = cycles, type = 0, config = 0x0, config1 = 0x0, config2 = 0x0, excl_usr = 0, excl_kern = 0, excl_host = 0, excl_guest = 1, precise_ip = 0, id = { 671, 672 }
# HEADER_CPU_TOPOLOGY info available, use -I to display
# HEADER_NUMA_TOPOLOGY info available, use -I to display
# pmu mappings: cpu = 4, software = 1, tracepoint = 2, ibs_fetch = 6, ibs_op = 7, breakpoint = 5
# ========
#
# Samples: 1K of event 'cycles'
# Event count (approx.): 1071717616
#
# Overhead  Command      Shared Object                     Symbol
# ........  .......  .................  .........................
#
    99.85%     test  test               [.] longa                
     0.08%     test  [kernel.kallsyms]  [k] call_timer_fn        
     0.08%     test  [kernel.kallsyms]  [k] task_work_run        
     0.00%     test  [kernel.kallsyms]  [k] clear_page_c         
     0.00%     test  [kernel.kallsyms]  [k] native_write_msr_safe


#
# (For a higher level overview, try: perf report --sort comm,dso)
#
于 2013-10-16T09:00:47.903 回答