1

我正在尝试将原始 PCM 音频数据编码为 u-law,这听起来很奇怪(当它听起来......)。我不太了解如何初始化我的AVCodecContext结构(和我的输入AVFrame)。

这是我的参数:

  • 输入:PCM(16 位签名)、MONO、44,1kHz(采样率)(来自我的 Android 设备 MIC)

  • 所需输出:G.711 u-law、MONO、8kHz(采样率)、64 kbits/s(比特率)(来自我的输出目标设备的文档)

我也知道我的输入 nb 样本,这就是我拥有的所有信息。

所以我AVCodecContext像这样初始化我的:

AVCodec* pCodec = avcodec_find_encoder(AV_CODEC_ID_PCM_MULAW);
// ...
AVCodecContext* pCodecContext = avcodec_alloc_context3(pCodec);
// ...
// Do I need input or output params in following lines?
pCodecContext->channels = 1:
pCodecContext->channel_layout = AV_CH_LAYOUT_MONO;
pCodecContext->sample_rate = 8000;
pCodecContext->bit_rate = 64000
pCodecContext->sample_fmt = AV_SAMPLE_FMT_S16;

AVFrame喜欢:

AVFrame* pFrame = av_frame_alloc();
pFrame->channels = 1;
pFrame->channel_layout = AV_CH_LAYOUT_MONO;
pFrame->sample_rate = 44100;
pFrame->format = AV_SAMPLE_FMT_S16;
pFrame->nb_samples = /*my audio data samples count*/;
avcodec_fill_audio_frame(pFrame, 1, AV_SAMPLE_FMT_S16, /*my audio data*/, /*my audio data size*/, 0);

avcodec_send_frame()然后,我用and编码avcodec_receive_packet()

所以我的问题是我不确定是否必须在不同的参数中输入或输出所需的值。可能我必须以一种方式进行编码,然后使用swresamplelib 进行“重新采样”。但就目前而言,我很确定我没有正确编码。请问有什么建议吗?谢谢!

4

1 回答 1

1

G.711 要求您的输入为 8kHz 单声道(例如 sample_rate 为 8000)。因此,在将原始 pcm 音频样本传递给 libavcodec 之前,您必须使用 swresample 或任何其他可以做到这一点的库将它们转换为 8kHz。如果您自己捕获原始 pcm,通常可以从 os sound api 请求 8kHz 采样率。

我很确定在安卓设备上你可以请求 8kHz 音频。G.711 是如此简单的编解码器,您不需要 libavcodec。您可以使用任何可用的 g711.c并为每个样本简单地调用linear2alawor 。linear2ulaw基本上linear2alaw还是linear2ulaw将每个 16 位音频样本转换成一个字节的 g711 比特流。

您还应该确保AVCodecContext正确初始化:

pCodecContext->channels = 1;
pCodecContext->channel_layout = AV_CH_LAYOUT_MONO; 
...
于 2017-05-15T09:23:43.823 回答