3

我目前正在编写一个多线程、高效且可扩展的算法。因为我必须猜测代码的参数并且我不确定计算在特定数据集上的执行情况,所以我想观察一个变量。该测试仅适用于真实世界的庞大数据集。可以在分析后分析收集的数据。想象一下下面的简单代码示例(实际代码可以包含多个观察点:

// function get's called by loops of multiple threads
void payload(data_t* data, double threshold) {
    double value = calc(data);
    // here I want to watch the value
    if (value < threshold) {
        doSomething(data);
    } else {
        doSomethingElse(data);
    }
}

我考虑了以下方法:

  1. 使用cout或其他系统输出
  2. 使用二进制输出(文件、网络)
  3. 通过 gdb/lldb 设置断点
  4. 通过 gdb/lldb 使用变量监视 + 日志记录

我对结果不满意,因为:要使用 1. 和 2. 我必须更改代码,但这是一个调试/评估任务。此外 1. 需要锁定和 1.+2。需要 I/O 操作,这会大大降低整个代码的速度,并且几乎不可能使用真实数据进行测试。3.也太慢了。要使用 4.,我必须知道变量地址,因为它不是全局变量,但是因为线程是由动态调度程序创建的,所以这需要对每个线程进行中断 + 步进。

所以我的结论是,我需要一个在机器代码级别工作的分析器/调试器,并且可以在没有双->字符串转换的情况下转储/记录/监视变量,并且效率很高,或者总结一下:我想分析我的算法的内部状态没有严重减速并且没有进行深度修改。有人知道能够做到这一点的工具吗?

4

2 回答 2

3

好的,这需要一些时间,但现在我可以为我的问题提出解决方案。它被称为跟踪点。它不是每次都破坏程序,而是更轻量级并且(理想情况下)不会过多地改变性能/时间。它不需要更改代码。以下是如何使用 gdb 使用它们的说明:

确保使用调试符号(使用-g标志)编译程序。现在,启动 gdb 服务器并提供一个网络端口(例如 10000)和程序参数:

gdbserver :10000 ./program --parameters you --want --to use

现在,切换到第二个控制台并启动 gdb(此处不需要程序参数):

gdb ./program

以下所有命令均在 gdb 命令行界面中输入。所以让我们连接到服务器:

target remote :10000

获得连接确认后,使用traceftrace将跟踪点设置到特定源位置(ftrace首先尝试,它应该更快,但不适用于所有平台):

trace source.c:127

这应该创建跟踪点 #1。现在您可以为此跟踪点设置一个操作。在这里我想收集数据myVariable

action 1
collect myVariable
end

如果需要大量数据或想稍后使用数据(重启后),您可以设置二进制跟踪文件:

tsave trace.bin

现在,开始跟踪并运行程序:

tstart
continue

您可以等待程序退出或使用 CTRL-C 中断程序(仍在 gdb 控制台上,而不是在服务器端)。继续告诉 gdb 您要停止跟踪:

tstop

现在我们来到了棘手的部分,我对下面的代码并不满意,因为它真的很慢:

set pagination off
set logging file trace.txt
tfind start
while ($trace_frame != -1)
set logging on
printf "%f\n", myVariable
set logging off
tfind
end

这会将所有变量数据转储到文本文件中。您可以在此处添加一些过滤器或准备工作。现在你已经完成了,你可以退出 gdb。这也将关闭服务器:

quit

有关详细文档,特别是关于过滤和更高级跟踪点位置的说明,您可以访问以下文档:http: //sourceware.org/gdb/onlinedocs/gdb/Tracepoints.html

要将跟踪文件写入与程序执行隔离开来,您可以使用 cgroups 或另一台连接网络的计算机。使用另一台计算机时,您必须将主机添加到端口信息中(例如192.168.1.37:10000)。要稍后加载二进制跟踪文件,只需如上所示启动 gdb(忘记服务器)并更改目标:

gdb ./program
target tfile trace.bin
于 2013-08-03T20:34:20.077 回答
1

您可以使用 gdb 调试器设置硬件观察点,例如,如果您有

bool b;

变量,并且您希望在每次它的值(通过任何线程)发生变化时收到通知,您将声明一个如下所示的观察点:

(gdb) watch *(bool*)0x7fffffffe344

例子:

root@comp:~# gdb prog
GNU gdb (GDB) 7.5-ubuntu
Copyright ...
For bug reporting instructions, please see:
<http://www.gnu.org/software/gdb/bugs/>...
Reading symbols from /dist/Debug/GNU-Linux-x86/cppapp_socket5_ipaddresses...done.
(gdb) watch *(bool*)0x7fffffffe344
Hardware watchpoint 1: *(bool*)0x7fffffffe344
(gdb) start
Temporary breakpoint 2 at 0x40079f: file main.cpp, line 26.
Starting program: /dist/Debug/GNU-Linux-x86/cppapp_socket5_ipaddresses 

Hardware watchpoint 1: *(bool*)0x7fffffffe344

Old value = true
New value = false
main () at main.cpp:50
50                  if (strcmp(mask, "255.0.0.0") != 0) {
(gdb) c
Continuing.
Hardware watchpoint 1: *(bool*)0x7fffffffe344

Old value = false
New value = true
main () at main.cpp:41
41              if (ifa ->ifa_addr->sa_family == AF_INET) { // check it is IP4
(gdb) c
Continuing.
mask:255.255.255.0
eth0 IP Address 192.168.1.5
[Inferior 1 (process 18146) exited normally]
(gdb) q
于 2013-08-03T16:27:56.480 回答