0

我希望提高我的 Circle Hough 变换算法的性能,因此我求助于使用 CUDA。我目前正在全局内存中使用原子操作来执行我知道可能很慢的投票。但是,我不确定如何将投票和这些投票的坐标位置存储在共享内存中,以便我可以将结果复制回全局内存。

有没有人对如何最好地做到这一点以实现 CHT 的最大性能有任何建议/建议?

非常感谢大家抽出宝贵的时间。

4

0 回答 0