我是 OpenCL 的新手,我正在编写一个 RSA 分解应用程序。理想情况下,应用程序应该在 NV 和 AMD GPU 目标上运行,但我没有找到一种简单的方法来确定每个 GPU 上的内核/流 proc 的总数。
有没有一种简单的方法可以确定任何硬件平台上总共有多少个核心/流 proc,然后在每个可用核心上生成一个分解线程?目标 RSA 模数将在共享内存中,并且每个因式分解线程对模数使用 Rho 因式分解攻击。
此外,是否知道 OpenCL 是否支持类似于 GNU MP 的多精度数学库来存储大型半素数?
提前致谢