我在 java 中编写了以下测试类来重现“错误共享”引入的性能损失。
基本上,您可以将数组的“大小”从 4 调整为更大的值(例如 10000),以打开或关闭“错误共享现象”。具体来说,当 size = 4 时,不同的线程更有可能更新同一缓存行中的值,从而导致更频繁的缓存未命中。理论上,当 size = 10000 时,测试程序应该比 size = 4 运行得快得多。
我在两台不同的机器上多次运行相同的测试:
机器 A: Lenovo X230 笔记本电脑 w/ Intel® Core™ i5-3210M 处理器(2 核,4 线程)Windows 7 64 位
大小 = 4 => 5.5 秒
大小 = 10000 => 5.4 秒
机器 B: Dell OptiPlex 780 w/ Intel® Core™2 Duo 处理器 E8400(2 核)Windows XP 32 位
大小 = 4 => 14.5 秒
大小 = 10000 => 7.2 秒
后来我在其他几台机器上进行了测试,很明显,错误共享只在某些机器上变得明显,我无法弄清楚造成这种差异的决定性因素。
任何人都可以看看这个问题并解释为什么这个测试类中引入的错误共享只在某些机器上变得明显吗?
public class FalseSharing {
interface Oper {
int eval(int value);
}
//try tweak the size
static int size = 4;
//try tweak the op
static Oper op = new Oper() {
@Override
public int eval(int value) {
return value + 2;
}
};
static int[] array = new int[10000 + size];
static final int interval = (size / 4);
public static void main(String args[]) throws InterruptedException {
long start = System.currentTimeMillis();
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
System.out.println("Array index:" + 5000);
for (int j = 0; j < 30; j++) {
for (int i = 0; i < 1000000000; i++) {
array[5000] = op.eval(array[5000]);
}
}
}
});
Thread t2 = new Thread(new Runnable() {
@Override
public void run() {
System.out.println("Array index:" + (5000 + interval));
for (int j = 0; j < 30; j++) {
for (int i = 0; i < 1000000000; i++) {
array[5000 + interval] = op.eval(array[5000 + interval]);
}
}
}
});
Thread t3 = new Thread(new Runnable() {
@Override
public void run() {
System.out.println("Array index:" + (5000 + interval * 2));
for (int j = 0; j < 30; j++) {
for (int i = 0; i < 1000000000; i++) {
array[5000 + interval * 2] = op.eval(array[5000 + interval * 2]);
}
}
}
});
Thread t4 = new Thread(new Runnable() {
@Override
public void run() {
System.out.println("Array index:" + (5000 + interval * 3));
for (int j = 0; j < 30; j++) {
for (int i = 0; i < 1000000000; i++) {
array[5000 + interval * 3] = op.eval(array[5000 + interval * 3]);
}
}
}
});
t1.start();
t2.start();
t3.start();
t4.start();
t1.join();
t2.join();
t3.join();
t4.join();
System.out.println("Finished!" + (System.currentTimeMillis() - start));
}
}