-3

我正在研究一个代码,它具有矩阵乘法以及其他复杂的数学函数,如 fft、lu、ifft、fftshift 等。我想知道的是当我更改输入参数时

  • 当我运行 CPU 程序时矩阵有多大
  • 理论上,内存使用量与矩阵大小的关系。
  • 当我使用移植的 OpenCL GPU 代码时,我的 2GB Radeon 可以处理多少。
4

1 回答 1

0
  • 内存使用量与总元素数乘以数据类型字节大小有关。假设您有一个 1000 x 1000 矩阵和 4 字节整数,那么您的矩阵数据大小将大约为 4*1000000 字节或 4 兆字节。
  • 可能您不需要担心内存限制,而“GPU 内存可以虚拟化,并且驱动程序将在需要/不需要时从 GPU 换入/换出内存”:

    如何确定 OpenCL 中的可用设备内存?

于 2013-04-29T13:20:26.057 回答