在 OpenCL C 内核代码中,默认的内置函数很好,但用户定义的函数呢?与内置的相比,它们是否有任何性能和内存下降?如果是这样,在 __kernel void 中编写上述用户定义函数一次或多次是否更好?
例如:-
gentype clamp ( gentype x,
gentype minval,
gentype maxval)
以上是一个内置函数,对性能没有影响,也不会减少gpu l0/l1缓存内存
通过用户定义的函数,我的意思如下
int Add(int a, int b)
{
return a + b;
}
这些函数是否对 l0/l1 内存有任何影响,如果是,那么最好不要将这些函数编写为函数,而是在任何地方使用代码?