6

我的库doctest在travis CI - x86/x64 Debug/Release linux/osx上使用 200 多个构建进行了测试,并使用了广泛的编译器 - 从 gcc 4.4 到 6 和 clang 3.4 到 3.8

我所有的测试都是通过 valgrind 和地址消毒剂(也是 UB 消毒剂)进行的。

我最近发现并非 ASAN 的所有功能都默认启用 - 例如:

  • check_initialization_order=true
  • detect_stack_use_after_return=true
  • strict_init_order=true

所以我启用了它们并开始收到代码错误,如下例所示。

int& getStatic() {
    static int data;
    return data;
}

int reg() { return getStatic() = 0; }

static int dummy = reg();

int main() { return getStatic(); }

编译g++ (Ubuntu 5.2.1-22ubuntu2) 5.2.1 20151010

g++ -fsanitize=address -g -fno-omit-frame-pointer -O2 a.cpp

并像这样跑:

ASAN_OPTIONS=verbosity=0:strict_string_checks=true:detect_odr_violation=2:check_initialization_order=true:detect_stack_use_after_return=true:strict_init_order=true ./a.out

产生以下错误:

==23425==AddressSanitizer CHECK failed: ../../../../src/libsanitizer/asan/asan_globals.cc:255 "((dynamic_init_globals)) != (0)" (0x0, 0x0)
    #0 0x7f699bd699c1  (/usr/lib/x86_64-linux-gnu/libasan.so.2+0xa09c1)
    #1 0x7f699bd6e973 in __sanitizer::CheckFailed(char const*, int, char const*, unsigned long long, unsigned long long) (/usr/lib/x86_64-linux-gnu/libasan.so.2+0xa5973)
    #2 0x7f699bcf2f5c in __asan_before_dynamic_init (/usr/lib/x86_64-linux-gnu/libasan.so.2+0x29f5c)
    #3 0x40075d in __static_initialization_and_destruction_0 /home/onqtam/a.cpp:10
    #4 0x40075d in _GLOBAL__sub_I__Z9getStaticv /home/onqtam/a.cpp:10
    #5 0x40090c in __libc_csu_init (/home/onqtam/a.out+0x40090c)
    #6 0x7f699b91fa4e in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x20a4e)
    #7 0x4007b8 in _start (/home/onqtam/a.out+0x4007b8)

g++-6 (Ubuntu 6.1.1-3ubuntu11~12.04.1) 6.1.1 20160511

当我执行以下三件事之一时,错误就会消失:

  • 使用 clang++(任何版本)而不是 g++
  • 删除-O2并使用-O0
  • 去掉static前面的dummy

为什么会这样?如果它是一个错误 - 是否被报告?如何避免?

编辑:

@vadikrobot 说即使这样:也会static int data = 0; static int dummy = data; int main() { }产生问题。

编辑:

@ead 的答案是正确的,但是我找到了一种方法来规避删除静态虚拟对象并且 asan 不再断言:

int& getStatic() {
    static int data = 0;
    return data;
}

int __attribute__((noinline)) reg(int* dummy_ptr) { *dummy_ptr = 5; return getStatic() = 0; }

static int __attribute__((unused)) dummy = reg(&dummy);

int main(int argc, char** argv) { return getStatic(); }
4

2 回答 2

5

这是 gcc 使用 asan 的问题。我还不足以说这是一个错误(因为我所知道的都来自逆向工程),但 gcc 至少还有一些改进的空间。但 asan 在处理此案时可能会更加稳健。

出了什么问题?对于我的解释,我想看一下 vadikrobot 示例的汇编代码,然后再解决您的问题:

static int data = 0; 
static int dummy = data; 
int main() { }

首先我们编译没有优化:(g++ -O0 -S 这里是整个汇编代码)

最重要的几点是:

- 有两个全局变量,fordatadummy整数静态变量:

.local  _ZL4data
.comm   _ZL4data,4,4
.local  _ZL5dummy
.comm   _ZL5dummy,4,4

- 在该部分.init_array中注明了在 . 之前调用的所有函数main。在我们的例子中,这是_GLOBAL__sub_I_main

.section    .init_array,"aw"
.align 8
.quad   _GLOBAL__sub_I_main

- 正如预期的那样,全局变量在某处被初始化_GLOBAL__sub_I_main

_GLOBAL__sub_I_main:
    ...
    #in this function is the initialization
    call    _Z41__static_initialization_and_destruction_0ii
    ...

确定之后,我们来看看优化后的版本

  1. 变量是本地的static,只能从这个翻译单元访问,它们在这里没有使用,所以它们根本没有使用,因此被优化了。
  2. section 中没有任何内容.init_array,因为没有什么要初始化的。
  3. 奇怪的是,还有一个未使用的_GLOBAL__sub_I_main函数,它什么也不做。我想它也应该被优化掉。

现在让我们看一下未优化的版本(此处-fsanitize=address为完整的汇编代码):

最重要的是:section.init_array现在有更多用于初始化 sanitizer 的函数,最终这一切都会导致这些重要函数按以下顺序调用:

call    __asan_init
call    __asan_register_globals
call    __asan_before_dynamic_init
call    __asan_report_store4
call    __asan_after_dynamic_init

优化版本有什么不同?

- 没有全局变量(毕竟它们被优化掉了),所以__asan_register_globals不被调用。还行吧。

- 但奇怪的是,该部分.init_array现在再次包含不需要的方法_GLOBAL__sub_I_main,它不初始化任何全局变量(它们被优化掉),但调用__asan_before_dynamic_init

_GLOBAL__sub_I_main:
    .cfi_startproc
    subq    $8, %rsp
    .cfi_def_cfa_offset 16
    movl    $.LC0, %edi
    call    __asan_before_dynamic_init
    ...

这样做的问题:似乎不允许在__asan_before_dynamic_init没有事先调用的情况下调用它,__asan_register_globals因为某些指针似乎是NULL- 您的错误跟踪是一个失败的断言。


确定之后,让我们来解决您的问题:

  1. static int dummy = reg();在这个翻译单元的任何地方都没有使用,因此被优化掉了,没有全局变量,你将在没有 的坏情况下__asan_before_dynamic_init运行__asan_register_globals

  2. 没有static,该变量dummy可以从不同的翻译单元使用,因此无法优化 - 存在全局变量,因此 __asan_register_globals被调用。

  3. 为什么 5.0 之前的 gcc 版本可以工作?可悲的是,他们不会优化未使用的全局static变量。


该怎么办?

  1. 您应该将此问题报告给 gcc。
  2. 作为一种解决方法,我会手动进行优化。

例如:

int& getStatic() {
    static int data=0;
    return data;
}

并删除静态变量dummy,也许还有函数reg(),如果它不用于其他目的。

于 2016-08-25T18:36:36.627 回答
1

这应该最近在 GCC 中得到修复:https ://gcc.gnu.org/bugzilla/show_bug.cgi?format=multiple&id=77396

于 2016-10-24T14:07:31.867 回答