我有一个现有的 MFC 应用程序,它使用 CPU 优化的 BLAS 库进行矩阵计算。我有兴趣在我的项目中添加 CuBLAS 计算功能,但我有以下两个问题:
1) 我不确定我是否需要在此时指定我自己的 CUDA 内核、线程和块配置。如果是这样,您建议在修改算法时最关注架构的哪些部分?
2) 我对 (a) 在 Visual Studio 中使用程序中的 CuBLAS 功能创建一个新项目或 (b) 在现有 MFC 项目中集成 CuBLAS 功能感兴趣。但是,除了遵循这样的指南之外,我在配置 Visual Studio 项目以正确使用 CUDA SDK 时遇到问题,如果我试图将其与现有项目集成,这可能无法正常工作。您对此有何建议?
提前感谢您的评论。