为了了解 if 语句与选择性乘法,我尝试了下面的代码,发现将结果乘以 0 而不是 failed-if-statement(false) 并乘以 1 而不是 pass-if-statement(true) ,如果只有 3-4 个双精度乘法,if 语句会更慢,并且计算总是更快。
问题:虽然这种乘法即使在 cpu 上也更快,但它在 GPU(opencl/cuda) 上会如何执行?我的投票是绝对加速。单精度乘法的精度损失如何?我知道不可能总是有 1.00000,乘以 0.999999。可以说我不介意第 5 位的 sp 精度损失。
这更适合整数,但这至少对浮点数有意义吗?如果 float/half 比双倍更快/更快,那么这将更快。
结果:
no if: 0.058515741 seconds
if(){}: 0.073415743 seconds
任何人都可以重现类似的结果吗?if(){} 是第二个测试,所以 JIT 不能作弊?
代码:
public static void main(String[] args)
{
boolean[]ifBool=new boolean[10000000];
byte[]ifThen=new byte[10000000];
double []data=new double[10000000];
double []data1=new double[10000000];
double []data2=new double[10000000];
for(int i=0;i<ifThen.length;i++)
{
ifThen[i]=(byte)(0.43+Math.random()); //1 =yes result add, 0= no result add
ifBool[i]=(ifThen[i]==1?true:false);
data[i]=Math.random();
data1[i]=Math.random();
data2[i]=Math.random();
}
long ref=0,end=0;
ref=System.nanoTime();
for(int i=0;i<data.length;i++)
{
// multiplying by zero means no change in data
// multiplying by one means a change in data
double check=(double)ifThen[i]; // some precision error 0.99999 ?
data2[i]+=(data[i]*data1[i])*check; // double checked to be sure
data[i]+=(data2[i]*data1[i])*check; // about adding the result
data1[i]+=(data[i]*data2[i])*check; // or not adding
//(adding the result or adding a zero)
}
end=System.nanoTime();
System.out.println("no if: "+(end-ref)/1000000000.0+" seconds");
ref=System.nanoTime();
for(int i=0;i<data.length;i++)
{
if(ifBool[i]) // conventional approach, easy to read
{
data2[i]+=data[i]*data1[i];
data[i]+=data2[i]*data1[i];
data1[i]+=data[i]*data2[i];
}
}
end=System.nanoTime();
System.out.println("if(){}: "+(end-ref)/1000000000.0+" seconds");
}
CPU 为 FX8150 @ 4GHz