我对 MediaCodec 或 MediaExtractor 一无所知,但我对 MediaRecorder 相当熟悉,并且已经成功实现了一个基于 SpyDroid 的 RTSP 服务器,它从 MediaRecorder 捕获 H264/AMRNB 输出。基本思想是代码创建一个本地套接字对并使用 MediaRecorder 的 setOutputFile 将输出写入该对中的一个套接字。然后,程序从另一个套接字读取视频或音频流,将其解析为数据包,然后将每个数据包包装成一个或多个通过 UDP 发送的 RTP 数据包。
确实,MediaRecorder 在完成后会添加 MOOV 标头,但如果您以 RTP 格式提供 H264 视频,这不是问题。基本上,视频流的开头有一个“mdat”标头。它有 4 个字节作为标头长度,然后是 4 个字节“mdat”。读取长度以找出标头有多长,验证它是 mdat 标头,然后跳过其余的标头数据。从那里开始,你会得到一个 NAL 单元流,它以 4 个字节作为单元长度。小的 NAL 单元可以在单个 RTP 数据包中发送,而较大的单元被分解为 FU 数据包。对于 RTSP,您还需要提供描述流的 SDP 标头。SpyDroid 通过将非常短的电影写入文件来计算 SDP 标头中的信息,然后读取此文件以从末尾提取 MOOV 标头。我的应用程序总是使用相同的大小、格式和比特率,所以我只提供一个静态字符串:
public static final String SDP_STRING =
"m=video 5006 RTP/AVP 96\n"
+ "b=RR:0\n"
+ "a=rtpmap:96 H264/90000\n"
+ "a=fmtp:96 packetization-mode=1;profile-level-id=428028;sprop-parameter-sets=Z0KAKJWgKA9E,aM48gA==;\n"
+ "a=control:trackID=0\n"
+ "m=audio 5004 RTP/AVP 96\n"
+ "b=AS:128\n"
+ "b=RR:0\n"
+ "a=rtpmap:96 AMR/8000\n"
+ "a=fmtp:96 octet-align=1;\n"
+ "a=control:trackID=1\n";
这是我的 640x480x10fps、H264 视频的标头,带有 8000/16/1 AMRNB 音频。
我可以警告您一件事:如果您使用的是 MediaRecorder,您的预览回调将永远不会被调用。这仅适用于相机模式,不适用于录制视频。在录制视频时,我找不到任何方法可以访问未压缩格式的预览图像。
我强烈建议查看 SpyDroid 的代码。这需要一些挖掘,但我敢打赌你想要的东西已经在那里了。