我想使用 Thrust 来评估由元素矩阵运算组成的表达式。为了清楚起见,让我们考虑如下表达式:
D=A*B+3*sin(C)
其中A
、B
和是矩阵C
,D
当然大小相同。
Thrust 快速入门指南提供了用作输入和输出的saxpy
示例y
,而在我的情况下,输出参数与输入参数不同,顺便说一下,输入参数不止两个。在与 CUDA 的逐元素向量乘法中,考虑了输出与输入不同但只有两个输入的情况。
任何人都可以就如何使用 Thrust 来实现上述表达式(输出矩阵不同于输入和两个以上的输入)提供一些建议(可能还有背后的理由)?谢谢。