4

我写的是;

#include <thrust/system_error.h>
#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/sequence.h>
#include <thrust/transform.h>
#include <thrust/replace.h>
#include <thrust/copy.h>
#include <thrust/functional.h>
#include <iostream>
#include <cmath> //std:sqr

using namespace thrust;

// Kernel Code
template <class K>
struct sum_square_functor{
    __host__ __device__ K operator()(const K& x, const K& y)const{
        return pow(x-y,2);
    }
};

//Test code on CPU
//void perform_euclidean(){
//
//}


int main(){
    device_vector<float> p_vec(1 << 20);
    device_vector<float> q_vec(1 << 20);
    device_vector<float> r_vec(1 << 20);
    generate(p_vec.begin(), p_vec.end(), rand);
    generate(q_vec.begin(), q_vec.end(), rand);
    // Current Thrust's transformations supports 2 input vectors, so we use it
    transform(p_vec.begin(), p_vec.end(), q_vec.begin(), r_vec.begin(), sum_square_functor<float>());

    int sum = thrust::reduce(r_vec.begin(), r_vec.end(), (int)0, thrust::plus<float>());
    std::cout << "sqrt(" << sum  << ")=" << sqrt(sum) << std::endl;
    return 0;
}

并且完整的错误消息是;

terminate called after throwing an instance of 'thrust::system::system_error'
  what():  unspecified launch failure

代码有什么问题?任何想法?

我发现错误是由错误引起的generate()但仍然无法摆脱错误?

4

1 回答 1

4

rand是一个基于主机库的函数。您不能直接在设备代码中使用它。当您尝试在设备向量上generate使用rand时,您正在创建一个尝试rand直接使用但失败的设备代码内核。

相反,在主机上创建这些向量并将它们复制到设备,或者使用设备兼容的随机发生器(推力有一些)。

你应该能够做到:

host_vector<float> h_p_vec(1 << 20);
host_vector<float> h_q_vec(1 << 20);
generate(h_p_vec.begin(), h_p_vec.end(), rand);
generate(h_q_vec.begin(), h_q_vec.end(), rand);
device_vector<float> p_vec = h_p_vec;
device_vector<float> q_vec = h_q_vec;
于 2013-06-20T12:39:17.467 回答