只是想巩固我对视频编解码器的理解,似乎找不到任何有关此的信息。
https://www.mediafire.com/file/cbx8sciq5mie94m/arrow.webm/file包含一个很小的 vp9 webm。这是我通过ffmpeg
简单的 gif -> webm 转换生成的。
源 gif 有一个13x11
分辨率。不知何故,输出视频也有一个13x11
分辨率。我试图理解这是怎么可能的。
据我所理解:
YUV420 像素格式将使这成为不可能,因为 2 的色度子采样因子强制要求除以二。
VP9 本身的最小块大小为 16x16(?),因此至少必须编码那么多数据(?)
因此,我假设我们在这里编码的 ~14x12 或 ~16x16 视频流被以某种方式缩放或裁剪到 13x11。
问题是我找不到任何关于这是如何工作的解释。
这是流的 ffprobe 输出:
[STREAM]
index=0
codec_name=vp9
codec_long_name=Google VP9
profile=Profile 0
codec_type=video
codec_time_base=1/60
codec_tag_string=[0][0][0][0]
codec_tag=0x0000
width=13
height=11
coded_width=13
coded_height=11
closed_captions=0
has_b_frames=0
sample_aspect_ratio=1:1
display_aspect_ratio=13:11
pix_fmt=yuv420p
level=-99
color_range=tv
color_space=unknown
color_transfer=unknown
color_primaries=unknown
chroma_location=unspecified
field_order=unknown
timecode=N/A
refs=1
id=N/A
r_frame_rate=60/1
avg_frame_rate=60/1
time_base=1/1000
start_pts=0
start_time=0.000000
duration_ts=N/A
duration=N/A
bit_rate=N/A
max_bit_rate=N/A
bits_per_raw_sample=N/A
nb_frames=N/A
nb_read_frames=N/A
nb_read_packets=N/A
DISPOSITION:default=1
DISPOSITION:dub=0
DISPOSITION:original=0
DISPOSITION:comment=0
DISPOSITION:lyrics=0
DISPOSITION:karaoke=0
DISPOSITION:forced=0
DISPOSITION:hearing_impaired=0
DISPOSITION:visual_impaired=0
DISPOSITION:clean_effects=0
DISPOSITION:attached_pic=0
DISPOSITION:timed_thumbnails=0
TAG:alpha_mode=1
TAG:ENCODER=Lavc58.91.100 libvpx-vp9
TAG:DURATION=00:00:00.600000000
[/STREAM]
最后一帧:
[FRAME]
media_type=video
stream_index=0
key_frame=0
pkt_pts=583
pkt_pts_time=0.583000
pkt_dts=583
pkt_dts_time=0.583000
best_effort_timestamp=583
best_effort_timestamp_time=0.583000
pkt_duration=16
pkt_duration_time=0.016000
pkt_pos=3639
pkt_size=15
width=13
height=11
pix_fmt=yuv420p
sample_aspect_ratio=1:1
pict_type=P
coded_picture_number=0
display_picture_number=0
interlaced_frame=0
top_field_first=0
repeat_pict=0
color_range=tv
color_space=unknown
color_primaries=unknown
color_transfer=unknown
chroma_location=unspecified
[/FRAME]
关闭coded_width
andcoded_height
值(应该在任何缩放(?)之前表示“真实”宽度/高度)加上sar
值 1,据我所知,这确实是一个 13x11 视频流,但这应该是不可能的,不是吗?
我的问题是,为什么这是一个有效的视频文件?
如果我尝试将像素格式zscale
的分辨率设为不均匀,YUV420
我会遇到预期的色度二次采样错误。