-1

我已经搜索了整个互联网,但我没有找到可靠的答案。我需要指出,我是 GPU 编程的新手,但我刚刚订购了我的 Jetson TK1 单元,因为我喜欢模拟并且我喜欢 Python。我已经在 PC 上试用了 Numpy,但我想将这些模拟带到 Android 上。我读过关于 PyCuda 和 Numba 的文章,但我更喜欢后者,因为它完全是在 python 中,我不必用 C 编写内核。我似乎不明白的是如何(在我的 Jetson TK1 上安装 numbapro ) 我将能够将我的代码指向 Tegra K1 SOC 的多核 ARM CPU,以及我将如何使用 CUDA 6 中可用的统一内存。请注意,Numba 还不支持 ARM LLVM。或者我是否需要启动强制性 C++ 和 CUDA C++ 类才能访问 CPU 内核/线程。

4

1 回答 1

1

@NyproTheGeek,

我和你有同样的问题;我花了很多时间试图让 NumbaPro 在我的 Jetson TK1 上运行,但一直陷入死胡同。由于互联网上几乎没有提到 NumbaPro + Jetson TK1,我最后给 Continuum Analytics 的人员发了电子邮件,他们回复说目前不支持 Jetson TK1。然而,他们也表示 Jetson TK1 在路线图上,尽管没有给出明确的日期。

您对不支持 LLVM 支持的 Numba(相对于 NumbaPro)的观察是正确的。我相信 Continuum Analytics 作为 NumbaPro 商业产品的一部分提供了该功能。

您可能已经尝试过 Numba 提供的 jit 装饰器。这确实通过编译代码提供了显着的性能提升,尽管通过 GPU 提供的火力几乎没有:-)

于 2014-10-15T15:34:03.760 回答