我正在做一个项目,我必须比较各种 gpu 卡以进行性能分析。
我在两个 GPU 中都运行了相同的 Canny Edge Detection 的 cuda 代码,发现 gtx 965 比 Tesla K20 快得多(200%)。我还观察到 Tesla C2075 的运行与 Tesla K20 的运行相同。
据我所知K20有2496核,965有1024核,C2075有448核。K20 和 C2075 是 NVIDIA Kepler 架构,965 是 Maxwell 架构。
我做错了什么或者导致这个问题的硬件部分有什么不同?
另外,我们可以使用任何程序或理论计算来检查显卡消耗的功率吗?