当我使用以下代码时:
#define MAX_RADIUS 55
#define KERNEL_SIZE (MAX_RADIUS * 2 + 1)
...
float[] kernel[KERNEL_RADIUS];
...
float4 PS_GaussianBlur(float2 texCoord : TEXCOORD) : COLOR0
{
float4 color = float4(0.0f, 0.0f, 0.0f, 0.0f);
//add the right side offset pixels to the color
for (int i = 0; i < MAX_RADIUS; i++)
{
if(kernel[i] != 0) //this will improve performance for lower filter radius's, but increases const register num
color += tex2D(colorMap, texCoord + offsets[i]) * kernel[i];
}
//add the left side offset pixels to the color
for (int j = 0; j < MAX_RADIUS; j++)
{
if(kernel[i] != 0)
color += tex2D(colorMap, texCoord - offsets[j]) * kernel[j];
}
//finally add the weight of the original pixel to the color
color += tex2D(colorMap, texCoord) * kernel[MAX_RADIUS];
return color;
}
if(kernel[i] != 0)
大大增加了使用的指令数量!
所以我的问题是:是什么增加了指令数?为什么在只有 110 条指令长的循环中使用 if 语句会增加 400 多条指令?
编辑:以上问题已编辑。我错误地认为,当它真的是指令时,寄存器正在被占用。但是,这个问题仍然适用。什么会导致 2 个 for 循环(每个长度为 55)将指令计数增加 400 以上,而在循环中只添加了 1 个 if 语句?