3

我正在尝试使用 Android 的 MediaCodec 套件编写音频重采样器。

我目前正在将 MP3 立体声音频文件输入 MediaExtractor,然后由 MediaCodec 解码。源音频的采样率为 48000。

我不明白的是我从解码器收到的前四个输出缓冲区:

  1. 尺寸 0,时间 0
  2. 大小 0,时间 24000
  3. 尺寸 4312,时间 48000
  4. 尺寸 4608,时间 72000
  5. 尺寸 4608,时间 96000
  6. 等等

这个答案这个答案这篇文章,我相信前两个缓冲区只是传播“编码器延迟”,可能会被丢弃。但是,我列出的第三个缓冲区让我陷入了循环。

对于缓冲区 #4(及以后),数学计算如下:

((4608 bytes) / (2 bytes/sample) / (2 channels)) 
    / ((48,000 samples/sec) / (1,000,000 us/sec))
= 24,000 us (i.e. the change in time between buffers)

缓冲区 #3 发生了什么?对数据的直接理解表明,音频在 48000 us 时间开始播放,然后在 72000 us 标记之前暂停,此时它开始连续播放,没有中断。

似乎更有可能在缓冲区#3 的数据之前有 296 个隐藏的 0,但是我的代码中的任何变量似乎都没有指示这个偏移量。任何人都可以为我阐明这一点吗?

4

1 回答 1

1

据我所知,音频 MediaCodec 的东西*并不真正关心时间戳与每个缓冲区相关联的内容。相反,它只是通过假设字节流中没有漏洞,使用指定的比特率神奇地重新计算每条数据的时间戳应该是什么。

作为该假设的支持证据,此答案中的解决方案之一只是建议增加时间戳值,而不是实际计算正确的时间戳。

因此,在这个问题的示例中,音频 MediaCodec stuffs* 将完全忽略所有时间戳值。MediaCodec 将假定缓冲区#3 字节#1 为时间 0,并且缓冲区#4 字节#1 的时间将从迄今为止处理的字节数中推断出来,而不是作为 24000 或 48000。

*即一个 MediaCodec 对象或一些相关的自定义组件

注意:MediaCodec 视频编码器似乎确实关心时间戳。

于 2017-01-22T04:37:21.723 回答