Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个特殊的问题。
我有一些使用 CUDA 4.1 在我的 macbook 上开发的研究代码,尤其是使用batchedgemm. 我现在必须在我从另一个机构借来的一组 gpu 上运行它。
batchedgemm
我的问题是集群只安装了 CUDA 4.0,他们不愿意快速升级。
有谁知道我是否可以在某处获得 batchedgemm 的源代码并将其编译为在 4.0 下工作?
我已经为批量乘法编写了自己的内核,但它的执行速度比库中的慢大约 10 倍——我想站在伟人的肩膀上,而不是站在他们的脚趾上。
我理解不愿意快速升级生产集群。许多集群使用模块系统,这意味着多个版本的 CUDA 工具包可以共存。但是,该驱动程序需要升级到支持正在使用的最新 CUDA 的版本。这就是他们不愿意的原因,因为他们需要测试用户的生产代码和应用程序以避免回归或失败。
由于 CUBLAS 不是开源的,我建议您尝试在单独的机器上开发您的代码,如果您从批处理中获得了很大的速度,请将其提交给管理员作为升级的理由。