2

有人可以澄清我的错误解释吗?我知道我的理解是不正确的,因为我的代码产生了输出(见问题的底部)。提前致谢。

为了澄清,以下行的每个部分是什么意思?:

*(u8 *)((u32)BufferAddress + (u32)i)

它与以下行有何不同:

*(u32 *)((u32)BufferAddress + (u32)i)

我对上面的解释是:

  1. segment1 = ((u32)BufferAddress + (u32)i) => 将地址确定为整数。
  2. segment2 = (u32 *)(segment1) => 将地址转换为指针,其中指针长度为 32 位。
  3. segment3 = *(segment2) => 取消引用指针以获得驻留在计算地址处的值。

我的解释有什么不正确之处?我认为我缺乏理解是在segment2区域......铸造(u32 *)和(u8 *)有什么区别?

这是让我意识到我有知识差距的代码:

初始化代码:

main(...) {
     ...
     u8 *Buffer = malloc(256);
     ...
     Buffer[0] = 1;
     Buffer[1] = 0;
     Buffer[2] = 0;
     Buffer[3] = 4;
     Buffer[4] = 0;
     Buffer[5] = 0;
     qFunction(... , Buffer, 6, ...);
     ...
}

qFunction(... , const u8 *BufferPointer, u32 BufferLength, ...) {
     u32 BufferAddress;
     ...
     BufferAddress = (u32) BufferPointer;
     ...

     /* Method 1: */
     for (i=0; i < BufferLength; i++)
          printf("%d, %p\n", BufferPointer[i], &BufferPointer[i]);

     /* Method 2: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u8 *)(BufferAddress+i), BufferAddress+i);

     /* Method 3: */
     for (i=0; i < BufferLength; i++)
          printf("%d, 0x%lx\n", *(u32 *)(BufferAddress+i), BufferAddress+i);
     ...
 }

方法 1 和方法 2 的输出如我所料(两者相同):

1, 0x1000000
0, 0x1000001
0, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

但是,方法 3 的输出对我来说似乎很奇怪;只有部分结果与方法 1/2 相同:

-1442840511, 0x1000000
11141120, 0x1000001
43520, 0x1000002
4, 0x1000003
0, 0x1000004
0, 0x1000005

我将不胜感激阅读材料的任何提示或参考。谢谢。

4

2 回答 2

4

我可以挑剔,说“你没有给我们足够的信息”。从技术上讲,这是正确的,但它只需要做出一些假设。 u8并且u32不是标准的 C 类型,您可以将它们定义为任何类型,但大概它们代表一个无符号的 8 位值(例如uchar)和一个无符号的 32 位值(例如unsigned)。假设是这样,让我们​​看看你理解的那些,并解释第三个留下的地方。

BufferPointer 是一个 const u8*,这意味着它是一个 u8 类型的常量指针。这意味着它指向的数组是 8 位无符号类型的。

现在,BufferAddress是 u32 - 这是典型的指针,至少在 32 位系统上。因为它们总是总线的大小,所以在 64 位系统上,指针是 64 位的。

因此,Method1 正在打印数组的元素和数组的地址。这很好,很酷。

方法2:

*(u8 *)(缓冲区地址+i), 缓冲区地址+i

BufferAddress 是一个无符号整数,您正在向它添加值以获取其他地址。这是数组的一个基本点——内存是连续的,你可以通过增加每个元素的字节数来访问下一个元素。因为它是一个 u8 数组,所以你只需前进 1。不过,这里有一个问题——如果它是一个整数数组,你会想要 BufferAddress+(i*4),而不是 BufferAddress+i,因为每个 int 的大小是 4字节。顺便说一句,这就是指针算法在 C 中的工作方式。如果您执行 `&(((u32 *)BufferAddress) + 1),您将得到 0x100004 而不是 0x100001,因为您将 BufferAddress 转换为 4 字节指针,编译器知道当您查看下一个元素时,它必须相距 4 个字节。

(BufferAddress+i)u8 数组的第 i 个元素的地址也是如此。将(u8 *)BufferAddress 从一个无聊的整数转换为指向 u8 类型的内存位置的指针,因此当您这样做时*(u8 *),编译器知道将其视为 u8。你可以这样做(u64 *),编译器会说“哦!这个内存区域是 64 位的”,并尝试以这种方式解释这些值。

这可能会清楚地说明方法 3 现在发生了什么。您获得了每个数组元素的适当地址,但您告诉编译器“将此内存区域视为 32 位数据”。因此,每次使用 *(u32 *) 时,都会读取数组的 4 个字节并将其视为无符号整数。顺便说一句,一旦 i >= 3,您就会遇到未定义的行为,因为您正在读取数组之外的内容。

让我试着可视化一下你在那个区域的记忆是什么样的:

0x1000000 = 1
0x1000001 = 0
0x1000002 = 0
0x1000003 = 4
0x1000004 = 0
0x1000005 = 0

对于方法 2,当 i = 2 时,您正在查看 BufferAddress (=0x1000000) + 3,即 0x1000002,其中包含数字 0。编译器知道它只有一个字节,所以就这样吧。

但是对于 method3,当 i = 3 时,您是在告诉编译器将其视为 32 位。所以它没有看到'0',它看到的是0、4、0、0,并用这些数字来得出一个整数值,肯定不会是4。

于 2013-06-26T22:42:12.890 回答
3
*(u8 *)((u32)BufferAddress + (u32)i)
*(u32 *)((u32)BufferAddress + (u32)i)

第一行在取消引用之前将指针转换为无符号的 8 位值,而秒数在取消引用之前将其转换为无符号的 32 位值。第一行取消引用单个字节,底部取消引用整个 4 个字节。

要解决您的其他问题:

我的解释有什么不正确之处?我认为我缺乏理解是在segment2区域......铸造(u32 *)和(u8 *)有什么区别?

地址长度为 32 位的解释对于代码的顶部和底部行都是正确的。

于 2013-06-26T22:37:12.180 回答