我正在为 Tensorflow 创建一个新的平台/设备。我已经注册了我的平台,现在正在开发一个操作。正如它在开发中发生的那样,我遇到了崩溃,并试图用 gdb 对其进行调试。问题是,虽然我在 bazel 中添加了标志来生成 tensorflow 的调试版本,但 gdb 没有在回溯中显示文件/行号,我也看不到变量和代码:
#0 0x00007fffe288d7f4 in tensorflow::Tensor::DebugString(int) const () from /tmp/TensorflowVT/vt_tf/lib/python3.4/site-packages/tensorflow/python/../libtensorflow_framework.so
#1 0x00007fffe4cd1373 in ConstOp::Compute(tensorflow::OpKernelContext*) () from /tmp/TensorflowVT/vt_tf/lib/python3.4/site-packages/tensorflow/python/_pywrap_tensorflow_internal.so
#2 0x00007fffe2a9ab4d in tensorflow::(anonymous namespace)::ExecutorState::Process(tensorflow::(anonymous namespace)::ExecutorState::TaggedNode, long long) () from /tmp/TensorflowVT/vt_tf/lib/python3.4/site-packages/tensorflow/python/../libtensorflow_framework.so
我正在构建这样的张量流:
bazel build --incompatible_remove_native_http_archive=false --incompatible_package_name_is_a_function=false --config=opt --verbose_failures --compilation_mode=dbg -c dbg --strip=never //tensorflow/tools/pip_package:build_pip_package
我还尝试手动查找崩溃点,并在 tensorflow/core/framework/tensor.cc中添加了调试打印,但是
是否可以获得文件/行和带注释的代码,以更好地了解我在哪里以及为什么会崩溃?