我正在研究 Arm Mali T-624 板,我想知道 gpu 算术流水线有多少阶段,我正在运行以下内核
__kernel void arithmetic_pipeline_depth(__global int * list)
{
for(int j=1000000;j!=0;j--){}
}
我正在从 1 到 512 个工作组运行这个内核,同时我将工作项的数量保持在第 1 位, 在此处输入图像描述
所以这个过期的结果是算术流水线大约有 38 个阶段长
你认为它是正确的吗?