0

我在这样的代码中有总线错误:

char* mem_original;
int int_var = 987411;
mem_original = new char [250];
memcpy(&mem_original[250-sizeof(int)], &int_var, sizeof(int));
...
const unsigned char* mem_u_const = (unsigned char*)mem_original;
...
const unsigned char *location = mem_u_const + 250 - sizeof(int);

std::cout << "sizeof(int) = " << sizeof(int) << std::endl;//it's printed out as 4
std::cout << "byte 0 = " << int(*location) << std::endl;
std::cout << "byte 1 = " << int(*(location+1)) << std::endl;
std::cout << "byte 2 = " << int(*(location+2)) << std::endl;
std::cout << "byte 3 = " << int(*(location+3)) << std::endl;
int original_var = *((const int*)location);
std::cout << "original_var = " << original_var << std::endl;

几次效果很好,打印出来:

sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
original_var = 987411

然后它失败了:

sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
Bus Error

它是在 Solaris OS (C++ 5.12) 上构建和运行的,Linux (gcc 4.12) 和 Windows (msvc-9.0) 上的相同代码运行良好。

我们可以看到:

  1. 内存是由 new[] 在堆上分配的。
  2. 内存是可访问的(我们可以逐字节读取)
  3. 内存完全包含应有的内容,而不是损坏的内容。

那么总线错误的原因可能是什么?我应该去哪里看?

UPD: 如果我最后 memcpy(...) locationoriginal_var它可以工作。但是问题出在*((const int*)location)哪里?

4

3 回答 3

4

对于没有对齐限制的硬件(例如 SPARC)经验的开发人员来说,这是一个常见问题。x86 硬件非常容忍未对齐的访问,尽管会影响性能。其他类型的硬件? SIGBUS.

这行代码:

int original_var = *((const int*)location);

调用未定义的行为。您正在接受unsigned char *并解释它所指向的内容int。你不能安全地做到这一点。时期。这是未定义的行为-出于您正在经历的原因。

您违反了严格的别名规则。请参阅什么是严格的别名规则?简而言之,您不能将一种类型的对象称为另一种类型。Achar *没有也不能指代一个int.

Oracle 的 Solaris Studio 编译器实际上提供了一个命令行参数,可以让您在 SPARC 硬件上摆脱它 - -xmemalign=1i(请参阅https://docs.oracle.com/cd/E19205-01/819-5265/bjavc/index.html)。尽管对 GCC 是公平的,但如果没有该选项,您在代码中执行的强制操作仍将SIGBUS在 Studio 编译器下进行。

或者,正如您已经指出的那样,您可以使用memcpy()复制字节,无论它们是什么 - 只要您知道源对象可以安全地复制到目标对象中 - 是的,在某些情况下这是正确的。

于 2017-03-06T21:49:47.387 回答
3

编译您的代码时,我收到以下警告:

main.cpp:19:26: warning: cast from 'const unsigned char *' to 'const int *' increases required alignment from 1 to 4 [-Wcast-align]
    int original_var = *((const int*)location);
                         ^~~~~~~~~~~~~~~~~~~~

这似乎是总线错误的原因,因为不正确对齐的访问会导致总线错误

于 2017-03-06T16:42:17.577 回答
2

虽然我现在无法访问 SPARC 来测试这个,但根据我在该平台上的经验,我很确定这条线是你的问题:

const unsigned char *location = mem_u_const + 250 - sizeof(int);

mem_u_const块最初是new为字符数组分配的。因为sizeof(unsigned char)是 1 和sizeof(int)4,所以要添加 246 个字节。这不是 4 的倍数。

在 SPARC 上,CPU 只能读取与 4 字节边界对齐的 4 字节字。您尝试读取未对齐的字是导致总线错误的原因。

我建议分配 a后跟struct一个数组,而不是一堆指针数学和像导致这个错误的那个那样的强制转换。unsigned charint

于 2017-03-06T17:27:00.617 回答