0

我正在根据 J.Welles Wilder Jr 所写的书编写抛物线时间价格系统程序。我已经完成了该程序,运行时间为 122 微秒。这远远高于基准限制。我正在寻找的是一些观点和提示,如果我

  1. 编写一个内核空间程序来实现相同的目的。通过驱动程序实现它
  2. [真的很喜欢这种方法]是否有可能,如果是,那么我应该如何以及从哪里开始寻找,将指令传递给图形驱动程序以执行步骤和计算(在某处的博客中阅读)。

提前致谢。

--->在 c 上编程

4

1 回答 1

2

使 GPU 非常快的原因是它可以异步运行大约 2000 〜(取决于卡)线程。如果您的代码可以分为线程,那么在 gpgpu 上进行计算可能会提高您的性能,因为正确使用时平均 CPU 速度为 50-100 GFlops,平均 GPU 速度为 1500~。此外,您可能需要考虑维护 gpgpu 代码的困难。我建议您,如果您有 NVidia GPU,您应该查看“托管 CUDA”,因为它包含一个调试器和一个 GPU 分析器,可以使用它。

TL;DR:仅将 gpgpu 用于异步代码,如果可能,最好使用“托管 CUDA”

于 2014-02-04T05:27:20.713 回答