我正在尝试查看是否有其他方法可以更有效地对该代码示例进行编码。这里,y 是 1xM 矩阵,(例如,1x1000),z 是 NxM 矩阵,(例如,5x1000)。
mean(ones(N,1)*y.^3 .* z,2)
这段代码工作正常,但我担心如果 N 增加很多,ones(N,1)*y.^3
可能会变得太浪费并使一切变慢。
想法?
我正在尝试查看是否有其他方法可以更有效地对该代码示例进行编码。这里,y 是 1xM 矩阵,(例如,1x1000),z 是 NxM 矩阵,(例如,5x1000)。
mean(ones(N,1)*y.^3 .* z,2)
这段代码工作正常,但我担心如果 N 增加很多,ones(N,1)*y.^3
可能会变得太浪费并使一切变慢。
想法?
对于这么小的矩阵来说,它并没有那么糟糕。很多时候,您可以从使用 bsxfun 来解决此类问题。这里的矩阵太小而无法真正获得任何东西。
>> N = 5;M =1000;
>> y = rand(1,M);
>> z = rand(N,M);
>> mean(ones(N,1)*y.^3 .* z,2)
ans =
0.12412
0.11669
0.12102
0.11976
0.12196
>> mean(bsxfun(@times,y.^3,z),2)
ans =
0.12412
0.11669
0.12102
0.11976
0.12196
>> z*y.'.^3/M
ans =
0.12412
0.11669
0.12102
0.11976
0.12196
如您所见,所有三种解决方案都返回相同的结果。所有都同样有效。
现在我将比较所需的时间。
>> timeit(@() mean(ones(N,1)*y.^3 .* z,2))
ans =
0.00023018
>> timeit(@() mean(bsxfun(@times,y.^3,z),2))
ans =
0.00026829
>> timeit(@() z*y.'.^3/M)
ans =
0.00016594
正如我所说,你不会获得太多。事实上,bsxfun 并没有什么收获,甚至还慢了一点。但是,如果您将表达式重写为我提出的第三种形式,您可以获得一点。不多,但有点。
编辑:如果 N 很大,那么时间会发生一些变化。
>> N = 2000;M = 1000;
>> y = rand(1,M);
>> z = rand(N,M);
>> timeit(@() mean(ones(N,1)*y.^3 .* z,2))
ans =
0.034664
>> timeit(@() mean(bsxfun(@times,y.^3,z),2))
ans =
0.012234
>> timeit(@() z*y.'.^3/M)
ans =
0.0017674
不同之处在于第一个解决方案显式创建了扩展的 y.^3 矩阵。这是低效的。
bsxfun 解决方案更好,因为它从不明确形成扩展 y.^3 矩阵。但是它仍然形成了一个 N×M 的乘积矩阵。所以这个解决方案仍然必须抓取并填充一大块内存。
你应该明白为什么矩阵向量乘法在所有情况下都是最好的。从来没有形成过大的矩阵。由于 * 只是一个点积(因此是乘积之和),因此它必须更有效。然后我在事后除以 M 以创建所需的平均值。
比上一个小改进...
>> timeit(@() z*(y.*y.*y).'/M)
ans =
0.0015793
略高于幂运算。
和时间?这来自 File Exchange,这是一个非常有用的实用程序,由 Steve Eddins 编写,用于计时代码片段。