有没有办法自动转换为在 FP32 GPU 上进行 FP32 计算而编写的代码,所以它总是可以进行 FP16 计算而不是 FP32?
我想要实现的是为旧 GPU(不支持 HALF 类型)运行代码,以在更新的 GPU 上运行......但我自己不通过代码......
如果不可能,请告诉我应该阅读哪些文件,自己动手做...
(新的 GPU 是 Radeon Vega Frontier,驱动程序是 ROCm 1.9.1,操作系统是 Ubuntu 18.04)(代码很广泛,由不同的模块组成......所以我不会在这里发布,除非被要求)