这个问题是关于 OpenCL 中可用的 mad 函数,它们承诺显着改进类型的计算:
a * b + c
如果用作mad(a,b,c)
并使用 cl-mad-enable 编译。
我已经尝试a + b * c + d * e
使用 mad 对非常大的尺寸进行计算,并期待有显着的改进。令人惊讶的是,它花了同样的时间。
如果有人有这方面的经验,我将不胜感激。我有一个应该可以工作的 jist,因为大多数资源都对mad()
. 注意:我使用的数据类型都是双精度的,如果它很重要,我的使用会mad
导致巨大的精度损失。