1

当一起编译的两个 C++ 文件各自包含不同的结构定义(具有相同名称)时,我在 C++ 程序中遇到了分段错误。

根据这个问题,我知道结构定义仅限于翻译单元(文件及其包含)。

但是,在编译时启用 -O1 或更多时会崩溃。以下最小代码重现了段错误。

该代码位于 3 个简短的 C++ 文件和 2 个头文件中:

// td_collision1.cc
#include <iostream>
#include <vector>
#include <cstdlib>
#include "td1.h"

struct Data
{
  long a;
  double m1;
  double m2;
};

void sz1(void) {
    std::cout << "Size of in collision1: " << sizeof(struct Data) << std::endl;
}

void collision1(void) {
    struct Data tmp;
    std::vector<struct Data> foo;
    for (int i=0; i<10; i++) {
        tmp.a = 1;
        tmp.m1 = 0;
        tmp.m2 = 0;
        foo.push_back(tmp);
    }
}
// td1.h
#include <iostream>

void collision1(void);
void sz1(void);

// td_collision2.cc
#include <iostream>
#include <vector>
#include <cstdlib>
#include "td2.h"

struct Data {
  long a;
  double m1; // note that there is one member less here
};

void sz2(void) {
    std::cout << "Size of in collision2: " << sizeof(struct Data) << std::endl;
}

void collision2(void) {
    struct Data tmp2;
    std::vector<struct Data> bar;
    for (int i=0; i<100; i++) {
        tmp2.a = 1;
        tmp2.m1 = 0;
        bar.push_back(tmp2); // errors occur here
    }
}
// td2.h
#include <iostream>

void collision2(void);
void sz2(void);

// td_main.cc
#include <iostream>
#include <cstdlib>
#include "td1.h"
#include "td2.h"

int main(void) {
    sz1();
    sz2();
    collision2();
}

使用带有 -O0 标志的 GCC 6.3 编译的这段代码在 valgrind 下运行良好且没有错误。但是,使用 -O1 或 O2 运行它会导致以下输出:

Size of in collision1: 24
Size of in collision2: 16
==326== Invalid write of size 8
==326==    at 0x400F6C: construct<Data, const Data&> (new_allocator.h:120)
==326==    by 0x400F6C: construct<Data, const Data&> (alloc_traits.h:455)
==326==    by 0x400F6C: push_back (stl_vector.h:918)
==326==    by 0x400F6C: collision2() (td_collision2.cc:22)
==326==    by 0x400FE8: main (td_main.cc:10)
==326==  Address 0x5aba1f0 is 0 bytes after a block of size 96 alloc'd
==326==    at 0x4C2E1FC: operator new(unsigned long) (vg_replace_malloc.c:334)
==326==    by 0x400DE9: allocate (new_allocator.h:104)
==326==    by 0x400DE9: allocate (alloc_traits.h:416)
==326==    by 0x400DE9: _M_allocate (stl_vector.h:170)
==326==    by 0x400DE9: void std::vector<Data, std::allocator<Data> >::_M_emplace_back_aux<Data const&>(Data const&) (vector.tcc:412)
==326==    by 0x400F7E: push_back (stl_vector.h:924)
==326==    by 0x400F7E: collision2() (td_collision2.cc:22)
==326==    by 0x400FE8: main (td_main.cc:10)
==326== 
==326== Invalid write of size 8
==326==    at 0x400F69: construct<Data, const Data&> (new_allocator.h:120)
==326==    by 0x400F69: construct<Data, const Data&> (alloc_traits.h:455)
==326==    by 0x400F69: push_back (stl_vector.h:918)
==326==    by 0x400F69: collision2() (td_collision2.cc:22)
==326==    by 0x400FE8: main (td_main.cc:10)
==326==  Address 0x5aba1f8 is 8 bytes after a block of size 96 alloc'd
==326==    at 0x4C2E1FC: operator new(unsigned long) (vg_replace_malloc.c:334)
==326==    by 0x400DE9: allocate (new_allocator.h:104)
==326==    by 0x400DE9: allocate (alloc_traits.h:416)
==326==    by 0x400DE9: _M_allocate (stl_vector.h:170)
==326==    by 0x400DE9: void std::vector<Data, std::allocator<Data> >::_M_emplace_back_aux<Data const&>(Data const&) (vector.tcc:412)
==326==    by 0x400F7E: push_back (stl_vector.h:924)
==326==    by 0x400F7E: collision2() (td_collision2.cc:22)
==326==    by 0x400FE8: main (td_main.cc:10)
==326== 
==326== 
==326== HEAP SUMMARY:
==326==     in use at exit: 0 bytes in 0 blocks
==326==   total heap usage: 5 allocs, 5 frees, 73,896 bytes allocated
==326== 
==326== All heap blocks were freed -- no leaks are possible
==326== 
==326== For counts of detected and suppressed errors, rerun with: -v
==326== ERROR SUMMARY: 191 errors from 2 contexts (suppressed: 0 from 0)

当 libc 重新分配时,该push_back()函数失败std::vector<struct Data> bar。(在我的例子中,它的大小最初是 4 个项目,然后在循环中调用 push_back() 时进一步调整向量的大小。)当struct Datatd_collision1.cc 的大小与 td_collision2.cc 中的大小相同时,程序不会崩溃.

因此,这两种结构定义之间似乎存在冲突。事实上,如果我重命名一个结构,这个错误显然会消失。但是,如上所述,我认为这不可能发生。我误解了什么?此外,如果我摆脱了功能collision1(),段错误就会消失(struct Data在collision1中可能因为未使用而被编译器抛弃)

我的理解是,这两个 CC 文件之间存在明确的分隔,如果标题中不存在结构,则不应出现“串扰”。

编辑:添加缺少的 td2.h

4

3 回答 3

7

您链接的答案是针对 C 语言的,而 C 不是 C++。

在 C++ 中(来自en.cppreference的引用,请参阅Danh对标准的回答),规则如下:

一个程序中可以有多个定义,只要每个定义出现在不同的翻译单元中,以下各项:类类型 [...],只要以下所有条件都为真:

  • 每个定义都由相同的标记序列组成(通常出现在同一个头文件中)

  • [...]

如果满足所有这些要求,则程序的行为就好像整个程序中只有一个定义。否则,行为是 undefined

您的两个定义显然违反了第一个条件,因此行为未定义。

于 2017-01-05T09:18:51.540 回答
1

basic.def.odr,(...被我省略了):

一个类类型(子句 [class])可以有多个定义,...... 给定这样一个名为 D 的实体在多个翻译单元中定义,则:

  • D 的每个定义都应由相同的记号序列组成;和
  • ...

如果 D 是一个模板并且在多个翻译单元中定义,那么前面的要求既适用于模板定义中使用的模板封闭范围的名称([temp.nondep]),也适用于该点的依赖名称实例化([temp.dep])。如果 D 的定义满足所有这些要求,那么行为就好像有一个 D的定义。如果 D 的定义不满足这些要求,那么行为是未定义的。

在您的程序中,struct Dataintd_collision1.cc和 in 的定义td_collision2.cc彼此不匹配,因此,定义struct Data不满足这些要求,则行为未定义。

于 2017-01-05T09:14:44.180 回答
0

好吧,您正在链接 C 答案,但您的问题是关于 C++ 的。两种语言,两种标准,两种答案。

也就是说,我相信 C 的答案应该是它是不允许的,根据单一定义规则(两种语言都有)。违反这是未定义的行为,其中包括分段错误。

于 2017-01-05T09:08:52.530 回答