1

我在设备向量上使用简单的推力:: 包容性扫描调用。在调试版本中,这将毫无错误地执行。但是,使用发布版本执行时会遇到错误。

此外,这似乎只影响推力::device<> 向量?

在抛出“thrust::system::system_error”的实例后调用终止 what(): 未指定的启动失败

我正在使用 eclipse nsight 来执行调试和发布版本。

#include <iostream>
using namespace std;

#include <thrust/scan.h>
#include <thrust/device_vector.h>

int main(void) {

    cout << "hello\n";

    int data[6] = {1, 0, 2, 2, 1, 3};

    thrust::inclusive_scan(data, data + 6, data); // in-place scan

    for(int i=0;i<6;i++) cout<< data[i] << "\n";

    cout << "inclusive scan on a device vector\n";

    thrust::device_vector<int> d_C_0(6);

    d_C_0[0] = 1;
    d_C_0[1] = 0;
    d_C_0[2] = 2;
    d_C_0[3] = 2;
    d_C_0[4] = 1;
    d_C_0[5] = 3;

    thrust::inclusive_scan(d_C_0.begin(), d_C_0.begin() + 6, d_C_0.begin()); // in-place scan

    for(int i=0;i<6;i++) cout<< d_C_0[i] << "\n";

    return 0;
}
4

1 回答 1

0

我的猜测是它没有通过调试案例,但通过了发布案例。

对于调试构建,Nsight EE 通常包含-G编译器开关。

推力(设备代码)通常-G开关不兼容。

如果您-G从编译命令中删除开关,我相信您的代码将正常运行——它对我有用。

如果这不能解决问题,请提供 Nsight EE 针对每种情况(调试和发布)使用的完整编译命令行,以及您正在运行的 GPU 和 CUDA 版本(5.0 或 5.5)。

于 2013-08-09T15:08:22.080 回答