使用 MediaExtractor 类,我可以从保存的 mp4 视频中获取编码的音频样本数据,如下所示:
ByteBuffer byteBuffer = ByteBuffer.allocate(1024 * 256);
MediaExtractor audioExtractor = new MediaExtractor();
try {
int trackIndex = -1;
audioExtractor.setDataSource(originalMediaItem.getFilePath());
for (int i = 0; i < audioExtractor.getTrackCount(); i++) {
MediaFormat format = audioExtractor.getTrackFormat(i);
String mime = format.getString(MediaFormat.KEY_MIME);
if (mime.startsWith("audio/")) {
trackIndex = i;
break;
}
}
audioExtractor.selectTrack(trackIndex);
mAudioFormatMedia = audioExtractor.getTrackFormat(trackIndex);
mAudioTrackIndex = mMediaMuxer.addTrack(mAudioFormatMedia);
int size = audioExtractor.readSampleData(byteBuffer, 0);
do {
if (audioExtractor.getSampleTrackIndex() == 1) {
long presentationTime = audioExtractor.getSampleTime();
mInputBufferHashMap.put(presentationTime, byteBuffer);
audioExtractor.advance();
size = audioExtractor.readSampleData(byteBuffer, 0);
}
} while (size >= 0);
audioExtractor.release();
audioExtractor = null;
} catch (IOException e) {
e.printStackTrace();
}
我有一个来自 GlSurface 的视频源,然后想使用 MediaMuxer 将此视频与前面提到的音频提取进行多路复用。在处理视频时,使用 hashmap 将音频交错到复用器中。我成功地混合了视频和音频并创建了可播放的 mp4 视频,但是音频听起来不像原始 mp4 的原始音频。
当我写入复用器时,我确实看到了预期的 bufferinfo.size 和 bufferInfo.presentationTimeUs:
mMediaMuxer.writeSampleData(mAudioTrackIndex, buffer, mAudioBufferInfo);
Log.d(TAG, String.format("Wrote %d audio bytes at %d", mAudioBufferInfo.size, mAudioBufferInfo.presentationTimeUs));
我尝试使用标准 inputBuffer、outputBuffer 和 MediaCodec,例如https://gist.github.com/ams/1991ab18fbcb0fcc2cf9,但这会产生相同的音频,据我了解,MediaExtractor 应该已经编码音频数据,因此数据应该能够直接通过管道传输。
同样有趣的是,当我在最初提取时检查标志时:
if( (audioExtractor.getSampleFlags() & MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0)
Log.d(TAG, "BUFFER_FLAG_END_OF_STREAM")
以上内容均未针对原始 mp4 视频打印。我现在质疑原始 mp4 视频,以及是否有可能为 mp4 提供不可提取的音轨,以及我如何才能确认这一点。
我相信我已经看过了关于 stackoverflow 的大多数 MediaExtractor 问题以及 github 上的很多 MediaExtractor 单例解决方案。有谁知道以另一种方式提取音频的方法,即使用 ExoPlayer(最好不是 ffmpeg,因为它在 android 项目上增加了大量开销)。如果我当前的实施中有任何错误,任何见解都会有所帮助!
编辑 1:这是 audioExtractor.getTrackFormat(trackIndex) 的格式:
{max-bitrate=512000, sample-rate=48000, track-id=2, durationUs=22373187, mime=audio/mp4a-latm, profile=2, channel-count=4, language=```, aac-profile =2,比特率=512000,最大输入大小=1764,csd-0=java.nio.HeapByteBuffer[pos=0 lim=2 cap=2]}