2

我查看分析结果并看到thrust::min_element()调用cudaMalloc(),因此使用了额外的内存。减少后我不需要数组数据,因此更愿意就地找到最小元素。可能吗?

4

1 回答 1

1

Thrust 的缩减只使用O(1)临时存储(实际上O(#processors)),但如果您坚持自己管理分配,您可以实现自己的自定义分配方案

于 2012-04-11T18:32:48.130 回答