4

我正在使用加速框架来优化我的 DSP 代码。有好几次我想将一个数组(或数组的一部分)的内容复制到另一个数组。

我似乎找不到合适的函数来执行此操作,因此我一直在做一些愚蠢的事情,即将数组乘以 1(或加 0)并以这种方式获取副本。

float one = 1;

float sourceArray = new float[arrayLength];
/////....sourceArray is filled up with data

float destArray = new float[arrayLength];

vDSP_vsmul(sourceArray, 1, &one, destArray, 1, arrayLength);

必须有更好的方法来做到这一点!?谢谢!

4

5 回答 5

8

如果您愿意使用 Accelerate 的 BLAS 部分,Jeff Biggus 的基准测试cblas_scopy()是比甚至更快memcpy()

于 2013-02-05T05:18:09.377 回答
7

memcpy怎么样?

#include <string.h>

memcpy(destArray, sourceArray, arrayLength * sizeof(float));
于 2013-02-04T23:50:43.867 回答
1

我可以想到更糟糕的方法vDSP_vsmul();你也可以这样做vvcopysign()

于 2013-02-05T02:11:29.527 回答
0

我认为这是最好的复制方式。

将一个子矩阵的内容复制到另一个子矩阵;单精度。https://developer.apple.com/documentation/accelerate/1449950-vdsp_mmov

func vDSP_mmov(_ __A: UnsafePointer<Float>, 
             _ __C: UnsafeMutablePointer<Float>, 
             _ __M: vDSP_Length, 
             _ __N: vDSP_Length, 
             _ __TA: vDSP_Length, 
             _ __TC: vDSP_Length)
于 2017-06-29T10:51:34.660 回答
0

您可以使用vDSP_vclrandvDSP_vadd如下:

int sourceLength = 3;
float* source = (float*)malloc(sourceLength * sizeof(float));
// source is filled with data, let's say [5, 5, 5]

int destinationLength = 10;
float* destination = (float*)malloc(destinationLength * sizeof(float));
// destination is filled with ones so [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

// Prepare the destination array to receive the source array
// by setting its values to 0 in the range [initialIndex, initialIndex + N-1]
int initialIndex = 2;
vDSP_vclr((destination+initialIndex), 1, sourceLength);

// We add source[0, N-1] into destination[initialIndex, initialIndex + N-1]
vDSP_vadd(source, 1, (destination+initialIndex), 1, (destination+initialIndex), 1, sourceLength);

或者更简洁,您也可以使用 Brad Larson 所说的 'cblas_scopy'

// Init source and destination
// We copy source[0, sourceLength] into destination[initialIndex, initialIndex + sourceLength]
cblas_scopy(sourceLength, source, 1, (destination+initialIndex), 1);
于 2017-02-24T14:59:08.027 回答