我正在寻找一个 C++ 固定大小的矩阵库,它将以与boost::numeric::ublas相同的方式实现向量和矩阵的最常见操作,但要在 CUDA 内核中使用(因此是固定大小的只使用本地内存而不是全局内存访问)。
我发现了几个基于主机的矩阵库:boost::numeric::ublas、Eigen、blitz,但它们没有固定大小的矩阵,我可以在我的内核上与 CUDA 一起使用。 Eigen具有我正在寻找的Matrix3f和相应的东西,但它无法在使用 nvcc 编译后存活下来(尽管在这个方向上似乎有一些进展,请参见此处)。
编辑:我在 Linux 上做所有这些事情,因此希望可能有一些跨平台的东西......