我正在寻找一种工具,旨在将一种格式的调试符号转换为在 GDB 下兼容的另一种格式。这似乎是一个乏味且可能复杂的项目,所以我不确定如何解决它。
最初,我的目标是将 borland 编译器发出的 Turbo 调试符号表 (TDS) 转换为类似 stabs 或 dwarf 格式的东西(我的研究似乎更喜欢 dwarf)。但理想情况下,我希望将我的工具设计为易于扩展,以便以后也可以转换其他格式。例如 codeview4 甚至可能是 pdb。
我创建这个的主要动机是:
- 互操作性。如果我可以将外部调试格式转换为 gdb 可以使用的形式,那么源级调试将可以在从 gcc 以外的其他编译器编译的二进制文件上进行。这意味着任何使用 gdb 作为后端的前端调试接口都可以正常工作。
- 不存在其他工具。我做了一个谷歌搜索类似的工具,我发现最接近的是tds2dbg。但它并不完全符合我的要求。
我目前必须处理的内容:
- 我已经有一个可以理解 TDS 调试格式的调试钩子 API 。我可以使用它来帮助我从要转换的源格式中获取所需的信息。
- 对于这个项目的范围,我主要感兴趣的是让它在 win32 环境下工作。我不太关心的其他平台和工具。
- 我要转换的目标 dwarf 调试格式。这个我真的一点都不熟悉。我以前使用过像 MinGW 这样的 gcc 移植编译器,并使用 gdb 以 dwarf 格式对其进行调试。但我不知道这种格式是如何在 Windows 上实现的。
最后一点是我关心的一点。我正在阅读 dwarf 规范文档,但我发现我很难真正理解和理解它是如何工作的。那里有很多细节,但同时它没有任何关于如何在不原生使用 ELF 的平台上的目标文件和图像文件上实现 dwarf 的细节——即 Windows 使用的 PE-COFF 格式. 该文档也是一个非常枯燥的阅读,长句子让人难以理解,图表和插图很少。我遇到了一个名为libDwarf的 API ,它应该可以将大部分解析工作从解释 dwarf 中解脱出来。问题是我仍在尝试构建它,但我还不知道它会如何工作。
我还没有编写任何代码,因为我不完全理解我需要构建什么。我有一种感觉,由于它的复杂性,最大的挑战将是弄清楚如何与 dwarf 一起工作。谷歌搜索有关 dwarf 如何在 Windows 下工作的信息也没有发现任何有用的信息。例如,没有关于在 PE 可执行映像文件中包含 dwarf 所需的“胶水”代码的信息。矮人部分是如何精确布置的?每个部分是否有任何标题信息?GDB 显然不只是采用“原始”的 dwarf 调试文件并按原样使用它。那么 gdb 期望调试文件采用什么样的格式才能使用它呢?
我的问题是,我怎样才能开始这样的项目?更重要的是,当我不可避免地遇到问题时,我可以向哪里寻求帮助?