我正在尝试使用 ffmpeg 的 av_seek_frame 方法在电影中搜索,但是我在确定如何生成要搜索的时间戳时遇到了最大的麻烦。假设我想向前或向后寻找 x 帧,并且我知道电影当前在哪个帧上,我将如何去做?
3 回答
我是这样做的:
// Duration of one frame in AV_TIME_BASE units
int64_t timeBase;
void open(const char* fpath){
...
timeBase = (int64_t(pCodecCtx->time_base.num) * AV_TIME_BASE) / int64_t(pCodecCtx->time_base.den);
...
}
bool seek(int frameIndex){
if(!pFormatCtx)
return false;
int64_t seekTarget = int64_t(frameIndex) * timeBase;
if(av_seek_frame(pFormatCtx, -1, seekTarget, AVSEEK_FLAG_ANY) < 0)
mexErrMsgTxt("av_seek_frame failed.");
}
AVSEEK_FLAG_ANY 可以搜索每一帧,而不仅仅是关键帧。
简单的回答:你应该有一个 AVFormatContext 对象。它的duration
属性告诉你你的文件有多长,时间戳乘以 1000 可以在 av_seek_frame 中使用,因此将其视为 100%。然后,您可以计算要搜索的视频的深度。
如果你想前进一帧,只需调用 av_read_frame 和 avcodec_decode_video 直到它用非零值填充 got_picture_ptr。在调用 avcodec_decode_video 之前,请确保来自 av_read_frame 的数据包来自视频流。然后 avcodec_decode_video 将填充 AVFrame 结构,您可以使用它来做任何事情。
不确定这是否超级准确,但以下内容非常简单并且似乎有效:
int n_seconds = 10; // seek forward 10 seconds
// time_base is in seconds, eg. the time base may be 1/1000th of a second,
// so just multiply by the reciprocal (den = denominator, num = numerator)
int64_t ts = av_rescale(
n_seconds,
format_ctx->streams[video_stream_index]->time_base.den,
format_ctx->streams[video_stream_index]->time_base.num
);
// even though it mentions in docs that you shouldn't use this because it is a
// work in progress, it's been around for more than a decade now, ffplay/ffmpeg/ffprobe
// all use it...it is the most consistent and easiest to use. the way I am using
// it here is to seek to the nearest keyframe (not frame!). I would not recommend
// using it in any other way:
// eg. AVSEEK_FLAG_ANY/FRAME/BACKWARD (BACKWARD is ignored anyways)
// 0 as flag seeks to keyframes only. I have set the max timestamp to the same value so
// that we only look for nearest keyframes behind us
int err = avformat_seek_file(pFormatContext, video_stream_index, 0, ts, ts, 0);
这寻求最近的关键帧!这可能离你想要的很远。但是,它只会落后于目标时间戳,因此您可以av_read_frame
直到到达您想要的位置,使用AVframe->pts
*AVStream->timebase
来计算帧的时间(用于av_rescale
执行此操作)。
另请注意,如果您需要向后搜索(即您已经阅读过的帧后面的帧av_read_frame
),或者您将av_read_frame
在一个帧上多次调用,您必须分别使用avcodec_send_packet
和发送/接收数据包/帧avcodec_receive_frame
,否则编解码器上下文将不同步(我认为这是问题所在?)。您不能只是空白地读取数据包。您还应该avcodec_flush_buffers
在寻找到您正在阅读的位置后面的新位置之后(您可能应该在每次寻找时都调用它,但我不确定性能)。
文档参考: