我查看分析结果并看到thrust::min_element()
调用cudaMalloc()
,因此使用了额外的内存。减少后我不需要数组数据,因此更愿意就地找到最小元素。可能吗?
问问题
266 次
1 回答
1
Thrust 的缩减只使用O(1)
临时存储(实际上O(#processors))
,但如果您坚持自己管理分配,您可以实现自己的自定义分配方案。
于 2012-04-11T18:32:48.130 回答