我目前正在开发嵌入 Vivante GC2100 GPU 的 i.MX6.Q 平台。在 Vivante 提供的(非常短的)技术规范中,它说如果我矢量化,我有 4 个着色器核心,如果我不矢量化,我有 16 个(http://www.vivantecorp.com/index.php/en/technology/gpgpu.html)。
当我直接恢复关于我的 GPU 的 OpenCL 信息时,它说我有 4 个计算单元,首选向量宽度是 4。
这是否意味着 GPU 会自动检测我是否矢量化?它会始终正确使用他可以使用的所有内核(在我的程序的当前版本中,我没有开发矢量化)并且有办法确定吗?
如果我不使用对齐的数据,我是否仍然需要矢量化以使 gpu 功能受益,或者我可以继续使用我的 gpu 而不进行矢量化?我目前正在为 OpenCL 准备 i.MX6.Q,所以无论如何我都会将我能做的矢量化并自己查看,但如果你们知道一些关于它的理论,我接受它!
巴蒂斯特