我在 Mathematica 中使用 NVIDIA K20 GPU。K20 的白皮书规定了以下规格:
- 2496 个单精度内核(每个多处理器 192 个 x 13 个多处理器)
- 832 个双精度内核(每个多处理器 64 个 x 13 个多处理器)
- 416 个特殊功能单元(每个多处理器 32 个 x 13 个多处理器)
但是,当我启动 Mathematica 并在加载 OpenCL 或 CUDA 后查看 GPU 的规格时,它说我只有 416 个内核(我附上了 Mathematica 命令的屏幕截图和报告的规格)。这是否与双精度内核或特殊功能单元的数量有关?Mathematica 在我告诉它我将编写什么样的代码(例如双精度、超越函数)之前报告了这些规范。