3

OpenCL 编译器选项-cl-fast-relaxed-math有什么作用?

从阅读文档来看——它看起来-cl-fast-relaxed-math允许内核对任何变量进行浮点数学运算——即使这些变量指向错误的数据类型、导致被零除或其他一些非法行为。

这个对吗?这个编译器选项在什么情况下有用?

4

1 回答 1

2

来自评论:

启用 -cl-finite-math-only 和 -cl-unsafe-math-optimizations。这两个选项通过删除对输入值的一些检查来提供额外的速度。IE:不检查 NaN 数字。但是,如果输入值恰好是非正态数,则结果未知。– DarkZeros

于 2014-08-08T09:25:01.577 回答