我正在将一些软件从 gcc-toolchain 移植到 armcc-toolchain(处理器保持不变(Cortex-A9))。在 C 代码中使用 memcpy。armcc 将调用 memcpy 替换为调用 __aeabi_memcpy。关于 __aeabi_memcpy 的常见问题解答如下(ARM 编译器如何处理 memcpy()?):
在许多情况下,编译对 memcpy() 的调用时,ARM C 编译器将生成对专门的、优化的库函数的调用。自 RVCT 2.1 起,这些专用功能成为 ARM 体系结构 ABI (AEABI) 的一部分,包括:
__aeabi_memcpy
This function is the same as ANSI C memcpy, except that the return value is void.
但与 gcc 相比,在我的所有情况下,对 memcpy 的调用都可以正常工作,而 armcc 对 memcpy 的调用分别 __aeabi_memcpy 不断产生对齐异常。同时我发现,对 memcpy 的调用可以处理源地址和目标地址不是 4 字节对齐的调用,但前提是它们都不是 4 字节对齐的。例如:
volatile uint32_t len = 10;
uint8_t* src = (uint8_t*)0x06000002; // 2-byte aligned
uint8_t* dst = (uint8_t*)(0x06000002 + 20); // 2-byte aligned
memcpy(dst, src, len);
将工作。但例如:
volatile uint32_t len = 10;
uint8_t* src = (uint8_t*)0x06000002; // 2-byte aligned
uint8_t* dst = (uint8_t*)(0x06000002 + 22); // 4-byte aligned
memcpy(dst, src, len);
将导致对齐异常。因为我使用的是 uint8_t* 类型的指针,所以我明确告诉编译器地址可以有任何对齐。但显然这个 __aeabi_memcpy 不能处理所有的对齐组合。我该如何解决这个问题(最好不使用用户特定版本的 memcpy 更改现有代码中对 memcpy 的所有调用)?感谢帮助。