1

我正在尝试为 Tesla C2075 上的多边形交集运行一种算法。但是当我尝试编译此算法时,编译器给了我错误:"Entry Function 'Polygon_Intersection'uses too much local data(0x40e8 bytes,0x4000)

我的算法有点复杂,它利用了内核中的大量局部变量。所以我的问题是,有没有办法解决这个问题,比如我可以使用全局内存为每个内核声明局部变量还是以某种方式使用共享内存?

4

1 回答 1

2

编译-arch=sm_20以启用设备端malloc,以便您可以将堆内存用于线程本地数据。

于 2012-09-13T01:27:40.323 回答