我正在查看带有可分离内核的 CUDA SDK 卷积,我有一个简单的问题,但找不到答案:
卷积给出内核的向量是否需要具有相同的大小?我可以先用向量 1x3 执行行卷积,然后再用另一个 5x1 执行列卷积吗?或者他们都需要相同的大小?谷歌没有帮助(或者我无法搜索答案)
我正在查看带有可分离内核的 CUDA SDK 卷积,我有一个简单的问题,但找不到答案:
卷积给出内核的向量是否需要具有相同的大小?我可以先用向量 1x3 执行行卷积,然后再用另一个 5x1 执行列卷积吗?或者他们都需要相同的大小?谷歌没有帮助(或者我无法搜索答案)