0

我有一个特殊的问题。

我有一些使用 CUDA 4.1 在我的 macbook 上开发的研究代码,尤其是使用batchedgemm. 我现在必须在我从另一个机构借来的一组 gpu 上运行它。

我的问题是集群只安装了 CUDA 4.0,他们不愿意快速升级。

有谁知道我是否可以在某处获得 batchedgemm 的源代码并将其编译为在 4.0 下工作?

我已经为批量乘法编写了自己的内核,但它的执行速度比库中的慢大约 10 倍——我想站在伟人的肩膀上,而不是站在他们的脚趾上。

4

1 回答 1

2

我理解不愿意快速升级生产集群。许多集群使用模块系统,这意味着多个版本的 CUDA 工具包可以共存。但是,该驱动程序需要升级到支持正在使用的最新 CUDA 的版本。这就是他们不愿意的原因,因为他们需要测试用户的生产代码和应用程​​序以避免回归或失败。

由于 CUBLAS 不是开源的,我建议您尝试在单独的机器上开发您的代码,如果您从批处理中获得了很大的速度,请将其提交给管理员作为升级的理由。

于 2012-02-28T22:06:36.593 回答