给定 3D 中数千个点的集合,我需要获取每个粒子的邻居列表,这些粒子落在某个截止值内(根据欧几里德距离),如果可能的话,从最远的最近排序。
在 CUDA 或 OpenCL 语言中,哪个是最快的 GPU 算法?
给定 3D 中数千个点的集合,我需要获取每个粒子的邻居列表,这些粒子落在某个截止值内(根据欧几里德距离),如果可能的话,从最远的最近排序。
在 CUDA 或 OpenCL 语言中,哪个是最快的 GPU 算法?
我所知道的最快的 GPU MD 代码之一是HALMD,它使用与CUDA SDK 示例“粒子”中使用的相同方法的(高度调整的)版本。HALMD 论文和 Particles白皮书都写得很清楚。下面的算法是将粒子分配到截止半径大小的箱中,根据该索引进行基数排序,然后查看相邻箱中的粒子。
我没有测试,使用它,没有。我刚刚用谷歌搜索并发布了我找到的第一个链接。