0

我正在开发一个 iOS 项目,该项目需要使用 remoteIO 音频单元作为输入/输出对 Speex 音频进行编码和解码。

我遇到的问题是,虽然 speex 没有打印任何错误,但我得到的音频在某种程度上可以识别为语音,但非常失真,有点像增益只是以机器人方式提高的声音。

以下是编码和解码函数(编码的输入是来自音频单元渲染函数的 320 字节有符号整数,解码的输入是 62 字节的压缩数据):

#define AUDIO_QUALITY 10
#define FRAME_SIZE 160
#define COMP_FRAME_SIZE 62

char *encodeSpeexWithBuffer(spx_int16_t *buffer, int *insize) {
    SpeexBits bits;
    void *enc_state;



    char *outputBuffer = (char *)malloc(200);

    speex_bits_init(&bits);
    enc_state = speex_encoder_init(&speex_nb_mode);

    int quality = AUDIO_QUALITY;

    speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality);


    speex_bits_reset(&bits);

    speex_encode_int(enc_state, buffer, &bits);



    *insize = speex_bits_write(&bits, outputBuffer, 200);


    speex_bits_destroy(&bits);
    speex_encoder_destroy(enc_state);


    return outputBuffer;
}

short *decodeSpeexWithBuffer(char *buffer) {
    SpeexBits bits;
    void *dec_state;

    speex_bits_init(&bits);

    dec_state = speex_decoder_init(&speex_nb_mode);

    short *outTemp = (short *)malloc(FRAME_SIZE * 2);

    speex_bits_read_from(&bits, buffer, COMP_FRAME_SIZE);
    speex_decode_int(dec_state, &bits, outTemp);

    speex_decoder_destroy(dec_state);
    speex_bits_destroy(&bits);


    return outTemp;
}

以及音频单元格式:

// Describe format
audioFormat.mSampleRate         = 8000.00;
audioFormat.mFormatID           = kAudioFormatLinearPCM;
audioFormat.mFormatFlags        =  kAudioFormatFlagIsSignedInteger |
kAudioFormatFlagsNativeEndian |
kAudioFormatFlagIsPacked;
audioFormat.mFramesPerPacket    = 1;
audioFormat.mChannelsPerFrame   = 1;
audioFormat.mBitsPerChannel     = 16;
audioFormat.mBytesPerPacket     = 2;
audioFormat.mBytesPerFrame      = 2;

任何地方都没有报告错误,我已经确认音频单元正在以 8000 的采样率处理

4

1 回答 1

0

经过几天的疯狂,我终于想通了。Speex 的诀窍是您必须初始化 SpeexBit 和编码器 void* 并在整个会话期间使用它们。因为我正在为每一段编码重新创建它们,所以会产生奇怪的声音结果。

一旦我搬家:

 speex_bits_init(&bits);
 enc_state = speex_encoder_init(&speex_nb_mode);

在while循环之外,一切都很好。

于 2012-07-17T17:14:40.797 回答