4

我需要处理来自 iPod 库的音频。为 iPod 库读取资产的唯一方法是 AVAssetReader。要使用音频单元处理音频,它需要采用立体声格式,因此我有左右声道的值。但是当我使用 AVAssetReader 从 iPod 库中读取资产时,它不允许我以立体声格式将其取出。它以交错格式出现,我不知道如何分成左右音频通道。

要到达我需要去的地方,我需要执行以下操作之一:

  1. 让 AVAssetReader 给我一个立体声格式的 AudioBufferList
  2. 将交错数据转换为非交错数据以获得我需要的立体声输出
  3. 通过音频队列服务发送它以获得我需要的自动缓冲

我似乎受限于现有的公共 API 可以做什么以及 AVAssetReader 在读取 iPod 库资产时所支持的功能。你会怎么办?如何获得需要使用音频单元处理的内容?

我的另一个限制是我无法一次读取整首歌曲,因为它会填满内存并使应用程序崩溃。这就是我想使用音频队列服务的原因。如果我可以将 iPod 库中的资产视为立体声格式的流,那么我的所有要求都会得到满足。

这甚至可以做到吗?是否有任何文档、博客或文章可以解释如何做到这一点?

4

1 回答 1

3

听起来你有几个问题堆积在那里。

当您设置 AVAssetReader 时,您可以传入设置字典。这是我创建 AVAssetReaders 的方式...

    AVAssetReader* CreateAssetReaderFromSong(AVURLAsset* songURL) {

    if([songURL.tracks count] <= 0)
        return NULL;


    AVAssetTrack* songTrack = [songURL.tracks objectAtIndex:0];

    NSDictionary* outputSettingsDict = [[NSDictionary alloc] initWithObjectsAndKeys:

                                        [NSNumber numberWithInt:kAudioFormatLinearPCM],AVFormatIDKey,
                                        //     [NSNumber numberWithInt:AUDIO_SAMPLE_RATE],AVSampleRateKey,  /*Not Supported*/
                                        //     [NSNumber numberWithInt: 2],AVNumberOfChannelsKey,   /*Not Supported*/

                                        [NSNumber numberWithInt:16],AVLinearPCMBitDepthKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsBigEndianKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsFloatKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsNonInterleaved,

                                        nil];

    NSError* error = nil;
    AVAssetReader* reader = [[AVAssetReader alloc] initWithAsset:songURL error:&error];

    {
        AVAssetReaderTrackOutput* output = [[AVAssetReaderTrackOutput alloc] initWithTrack:songTrack outputSettings:outputSettingsDict];
        [reader addOutput:output];
        [output release];
    }

    return reader;
}

因此,就拆分左右声道而言,您可以根据您的“AVLinearPCMBitDepthKey”循环数据。

所以像这样的16位......

for (j=0; j<tBufCopy; j++, pAD+=2) {            // Fill the buffers...
    mProcessingBuffer.Left[(tBlockUsed+j)] = ((sint32)pAD[0]);
    mProcessingBuffer.Right[(tBlockUsed+j)] = ((sint32)pAD[1]);
}

现在我假设你需要这个来进行处理。但是具有交错格式的数据确实非常好。您通常可以采用直接交错格式并将其直接传递回 AudioQueue 或远程 I/O 回调,它会正确播放。

为了使用 AudioQueue 框架播放音频,数据应遵循以下流程:

AVAssetReader -> NSData 缓冲区 -> AudioQueueBuffer

然后在它要求更多数据的 AudioQueue 回调中,只需传递 AudioQueueBuffer。就像是...

- (void) audioQueueCallback:(AudioQueueRef)aq  buffer:(AudioQueueBufferRef)buffer {

    memcpy(buffer->mAudioData, srcData, mBufferByteSize);
    //Setup buffer->mAudioDataSize

    //...

    AudioQueueEnqueueBuffer(mQueue, buffer, 0 /*CBR*/, 0 /*non compressed*/);
}
于 2011-08-23T17:28:20.343 回答