我在工作组大小为 16*16 且工作全局大小为 1024*1024 的 NDRange 上执行 OpenCL 程序。应用是矩阵乘法。当两个输入矩阵的大小都很小时,它工作得很好。但是当输入矩阵的大小变大,例如大于20000*20000时,enqueuendrangekernrl函数报错“CL_MEM_OBJECT_ALLOCATION_FAILURE”。
我很困惑。我不熟悉内存分配。什么原因?
我在工作组大小为 16*16 且工作全局大小为 1024*1024 的 NDRange 上执行 OpenCL 程序。应用是矩阵乘法。当两个输入矩阵的大小都很小时,它工作得很好。但是当输入矩阵的大小变大,例如大于20000*20000时,enqueuendrangekernrl函数报错“CL_MEM_OBJECT_ALLOCATION_FAILURE”。
我很困惑。我不熟悉内存分配。什么原因?