在什么情况下我应该期望 memcpys 在现代 INTEL/AMD 硬件上胜过分配?我在 32 位 Intel 平台上使用 GCC 4.2.x(但也对 64 位感兴趣)。
问问题
23876 次
1 回答
44
你永远不应该期望他们胜过分配。原因是,当编译器认为它会更快时(如果您使用优化标志),编译器无论如何都会使用 memcpy。如果不是,并且如果结构足够小以适合寄存器,则可以使用直接寄存器操作,这根本不需要任何内存访问。
GCC 内部有特殊的块移动模式,可以确定何时直接更改寄存器/内存单元,或何时使用 memcpy 函数。请注意,在分配结构时,编译器在编译时知道移动将有多大,因此它可以展开小副本(例如,在行中执行 n 次移动而不是循环)。注意-mno-memcpy
:
-mmemcpy
-mno-memcpy
Force (do not force) the use of "memcpy()" for non-trivial block moves.
The default is -mno-memcpy, which allows GCC to inline most constant-sized copies.
谁比编译器本身更清楚何时使用 memcpy?
于 2008-11-27T15:24:49.827 回答