我一直在努力解决 CUDA 中的一个问题。我写了一个递归内核(最新允许)。.cu 文件是包含许多对象的大型项目的一部分。内核的参数之一是 Piece 对象( Piece.cpp ),如下所示:
parallelKernel (Piece* piece, vector upcomingPieces)
当我需要递归调用时,我会建立下一块索引,所以我写了这样的东西:
Piece *nextPiece = upcomingPieces[nextPieceIndex];
parallelKernel (nextPiece, upcomingPieces);
但我在编译时得到一个错误:
error: cannot pass an argument with a user-provided copy-constructor to a device-side kernel launch
现在,我一直在尝试编写一个复制构造函数,但我似乎无法做到正确。谁能提供更多有关此的见解?