今天我写了一些代码来测试互斥量的性能。
这是boost(1.54)版本,在vs2010上编译,O2优化:
boost::mutex m;
auto start = boost::chrono::system_clock::now();
for (size_t i = 0; i < 50000000; ++i) {
boost::lock_guard<boost::mutex> lock(m);
}
auto end = boost::chrono::system_clock::now();
boost::chrono::duration<double> elapsed_seconds = end - start;
std::cout << elapsed_seconds.count() << std::endl;
这是标准版本,在 VS2013 上编译,也有 O2 优化:
std::mutex m;
auto start = std::chrono::system_clock::now();
for (size_t i = 0; i < 50000000; ++i) {
std::lock_guard<std::mutex> lock(m);
}
auto end = std::chrono::system_clock::now();
std::chrono::duration<double> elapsed_seconds = end - start;
std::cout << elapsed_seconds.count() << std::endl;
有点不同,但做同样的事情。我的 CPU 是 Intel Core i7-2600K,我的操作系统是 Windows 7 64bit,结果是:0.7020s vs 2.1684s,3.08 倍。
boost::mutex 会先尝试 _interlockedbittestandset ,如果失败了,大奶酪 WaitForSingleObject 会排在第二位,简单易懂。
VS2013 的 std::mutex 似乎要复杂得多,我已经尝试理解它但我不明白,为什么它这么复杂?有更快的方法吗?