具有 DDR3 双通道内存的 Core 2 处理器的理论最大内存带宽令人印象深刻:根据Wikipedia关于架构的文章,每秒 10+ 或 20+ GB。但是,股票 memcpy() 调用无法达到此目的。(3 GB/s 是我在此类系统上见过的最高值。)这可能是由于操作系统供应商要求 memcpy() 根据处理器的特性针对每条处理器线进行调整,因此库存 memcpy() 实现在广泛的品牌和线路上应该是合理的。
我的问题:是否有可在 C 程序中使用的针对 Core 2 或 Core i7 处理器的免费、高度调整的版本?我敢肯定,我不是唯一一个需要它的人,每个人都对自己的 memcpy() 进行微优化会浪费很大的精力。