我目前正在构建一个应用程序,从我的 iPhone 的麦克风中读取音频,然后进行一些处理和视觉效果。当然,我首先从音频开始,但遇到了一个小问题。
我将我的采样率定义为 44100 Hz,并将我的缓冲区定义为容纳 4096 个样本。确实如此。但是,当我打印出这些数据时,将其复制到 MATLAB 中以再次检查准确性,我必须使用的采样率是我的 iPhone 定义的速率的一半,即 22050 Hz,以确保它是正确的。
我认为它与以下代码以及它如何为每个数据包放置 2 个字节有关,当我循环通过缓冲区时,缓冲区吐出整个数据包,我的代码假定它是一个数字。所以我想知道的是如何拆分这些数据包并将它们作为单独的数字读取。
- (void)setupAudioFormat {
memset(&dataFormat, 0, sizeof(dataFormat));
dataFormat.mSampleRate = kSampleRate;
dataFormat.mFormatID = kAudioFormatLinearPCM;
dataFormat.mFramesPerPacket = 1;
dataFormat.mChannelsPerFrame = 1;
// dataFormat.mBytesPerFrame = 2;
// dataFormat.mBytesPerPacket = 2;
dataFormat.mBitsPerChannel = 16;
dataFormat.mReserved = 0;
dataFormat.mBytesPerPacket = dataFormat.mBytesPerFrame = (dataFormat.mBitsPerChannel / 8) * dataFormat.mChannelsPerFrame;
dataFormat.mFormatFlags =
kLinearPCMFormatFlagIsSignedInteger |
kLinearPCMFormatFlagIsPacked;
}
如果我描述的内容不清楚,请告诉我。谢谢!
编辑
添加我用来打印数据的代码
float *audioFloat = (float *)malloc(numBytes * sizeof(float));
int *temp = (int*)inBuffer->mAudioData;
int i;
float power = pow(2, 31);
for (i = 0;i<numBytes;i++) {
audioFloat[i] = temp[i]/power;
printf("%f ",audioFloat[i]);
}