我正在使用 libogg 和 libogg,我已成功将这些库添加到我的 iPhone xCode 项目中,并使用 Speex 对我的声音进行编码。问题是我无法弄清楚如何用 ogg 打包这些音频数据包。有人知道这种数据包的外观或有我可以使用的参考代码吗?
我知道在 Java 中它非常简单(你有一个专门的功能)但在 iOS 上却不是。请帮忙。
UPD 10.09.2013:请看演示项目,它基本上从波形容器中获取 pcm 音频数据,使用 speex 编解码器对其进行编码,并将所有内容打包到 ogg 容器中。也许稍后我会为 IOS 上的所有 speex 例程创建一个成熟的库/框架。
UPD 16.02.2015:演示项目在 GitHub 上重新发布。
我最近也在 iOS 上尝试使用 Speex,取得了不同程度的成功,但这是我发现的一些东西。基本上,如果你想将一些 speex 编码的语音打包到一个 ogg 文件中,你需要遵循三个步骤(假设 libogg 和 libspeex 已经编译并添加到项目中)。
1)添加第一个带有Speex header的ogg页面;libspeex 为此提供了内置工具(下面的代码来自我的项目,不是最佳的,只是为了举例):
// create speex header
SpeexHeader spxHeader;
SpeexMode spxMode = speex_wb_mode;
int spxRate = 16000;
int spxNumberOfChannels = 1;
speex_init_header(&spxHeader, spxRate, spxNumberOfChannels, &spxMode);
// set audio and ogg packing parameters
spxHeader.vbr = 0;
spxHeader.bitrate = 16;
spxHeader.frame_size = 320;
spxHeader.frames_per_packet = 1;
// wrap speex header in ogg packet
int oggPacketSize;
_oggPacket.packet = (unsigned char *)speex_header_to_packet(&spxHeader, &oggPacketSize);
_oggPacket.bytes = oggPacketSize;
_oggPacket.b_o_s = 1;
_oggPacket.e_o_s = 0;
_oggPacket.granulepos = 0;
_oggPacket.packetno = 0;
// submit the packet to the ogg streaming layer
ogg_stream_packetin(&_oggStreamState, &_oggPacket);
free(_oggPacket.packet);
// form an ogg page
ogg_stream_flush(&_oggStreamState, &_oggPage);
// write the page to file
[_oggFile appendBytes:&_oggStreamState.header length:_oggStreamState.header_fill];
[_oggFile appendBytes:_oggStreamState.body_data length:_oggStreamState.body_fill];
2) 添加带有Vorbis 注释的第二个 ogg 页面:
// form any comment you like (I use custom struct with all fields)
vorbisCommentStruct *vorbisComment = calloc(sizeof(vorbisCommentStruct), sizeof(char));
...
// wrap Vorbis comment in ogg packet
_oggPacket.packet = (unsigned char *)vorbisComment;
_oggPacket.bytes = vorbisCommentLength;
_oggPacket.b_o_s = 0;
_oggPacket.e_o_s = 0;
_oggPacket.granulepos = 0;
_oggPacket.packetno = _oggStreamState.packetno;
// the rest should be same as in previous step
...
3) 以类似的方式添加带有 speex 编码音频的后续 ogg 页面。
首先决定你想在每个 ogg 页面上有多少帧音频数据(0-255;我很随意地选择了 79):
_framesPerOggPage = 79;
然后对于每一帧:
// calculate current granule position of audio data within ogg file
int curGranulePos = _spxSamplesPerFrame * _oggTotalFramesCount;
// wrap audio data in ogg packet
oggPacket.packet = (unsigned char *)spxFrame;
oggPacket.bytes = spxFrameLength;
oggPacket.granulepos = curGranulePos;
oggPacket.packetno = _oggStreamState.packetno;
oggPacket.b_o_s = 0;
oggPacket.e_o_s = 0;
// submit packets to streaming layer until their number reaches _framesPerOggPage
...
// if we've reached this limit, we're ready to create another ogg page
ogg_stream_flush(&_oggStreamState, &_oggPage);
[_oggFile appendBytes:&_oggStreamState.header length:_oggStreamState.header_fill];
[_oggFile appendBytes:_oggStreamState.body_data length:_oggStreamState.body_fill];
// finally, if this is the last frame, flush all remaining packets,
// which have been created but not packed into a page, to the last page
// (don't forget to set oggPacket.e_o_s to 1 for this frame)
就是这样。希望它会有所帮助。欢迎任何更正或问题。