7

我正在尝试访问 iPhone/iPad 上音频文件的原始数据。我有以下代码,这是我需要的基本路径。但是,一旦有了 AudioBuffer,我就很难过。

AVAssetReader *assetReader = [AVAssetReader assetReaderWithAsset:urlAsset error:nil];
AVAssetReaderTrackOutput *assetReaderOutput = [AVAssetReaderTrackOutput assetReaderTrackOutputWithTrack:[[urlAsset tracks] objectAtIndex:0] outputSettings:nil];
[assetReader addOutput:assetReaderOutput];
[assetReader startReading];

CMSampleBufferRef ref;
NSArray *outputs = assetReader.outputs;
AVAssetReaderOutput *output = [outputs objectAtIndex:0];
int y = 0;
while (ref = [output copyNextSampleBuffer]) {
    AudioBufferList audioBufferList;
    CMBlockBufferRef blockBuffer;
    CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer(ref, NULL, &audioBufferList, sizeof(audioBufferList), NULL, NULL, 0, &blockBuffer);
    for (y=0; y<audioBufferList.mNumberBuffers; y++) {
        AudioBuffer audioBuffer = audioBufferList.mBuffers[y];
        SInt16 *frames = audioBuffer.mData;
        for(int i = 0; i < 24000; i++) { // This sometimes crashes
            Float32 currentFrame = frames[i] / 32768.0f;
        }
    }
}

本质上,我不知道如何判断每个缓冲区包含多少帧,因此我无法可靠地从中提取数据。我是处理原始音频数据的新手,因此我愿意接受有关如何最好地读取 AudioBuffer 结构的 mData 属性的任何建议。过去我也没有对 void 指针做太多事情,所以在这种情况下提供帮助也会很棒!

4

1 回答 1

14

audioBuffer.mDataByteSize 告诉您缓冲区的大小。你知道吗?以防万一你没有看过 struct AudioBuffer 的声明。您应该始终查看头文件以及文档。

要使 mDataByteSize 有意义,您必须知道数据的格式。输出值的计数是 mDataByteSize/sizeof(outputType)。但是,您似乎对格式感到困惑 - 您必须在某处指定它。首先,您将其视为 16 位带符号整数

SInt16 *frames = audioBuffer.mData

然后你把它当作 32 位浮点数

Float32 currentFrame = frames[i] / 32768.0f

在您之间假设有 24000 个值,如果不完全是 24000 个 16 位值,这当然会崩溃。此外,您将数据称为“框架”,但您真正的意思是样本。您称为“currentFrame”的每个值都是音频的一个样本。“帧”通常指的是 .mData 之类的样本块

所以,假设数据格式是 32 位浮点数(请注意,我不知道是不是,它可能是 8 位整数,或者我所知道的 32 位固定)

for( int y=0; y<audioBufferList.mNumberBuffers; y++ )
{
  AudioBuffer audioBuffer = audioBufferList.mBuffers[y];
  int bufferSize = audioBuffer.mDataByteSize / sizeof(Float32);
  Float32 *frame = audioBuffer.mData;
  for( int i=0; i<bufferSize; i++ ) {
    Float32 currentSample = frame[i];
  }
}

请注意,sizeof(Float32) 始终为 4,但为了清楚起见,我将其保留。

于 2010-11-28T23:07:06.977 回答