谁能以简单明了的方式解释MPEG4如何压缩数据。我主要对视频感兴趣。我知道它有不同的标准或部分。我只是在寻找主要的整体压缩方法,如果有 MPEG4 的话。
4 回答
MPEG-4 是一个巨大的标准,它采用了许多技术来实现它能够实现的高压缩率。
通常,视频压缩涉及尽可能多地丢弃信息,同时对最终用户的观看体验产生最小的影响。例如,使用二次采样 YUV 而不是 RGB 会立即将视频大小减半。这是可能的,因为人眼对颜色的敏感度低于对亮度的敏感度。在 YUV 中,Y 值表示亮度,U 和 V 值表示颜色。因此,您可以丢弃一些减小文件大小的颜色信息,而不会让查看者注意到任何差异。
在那之后,大多数压缩技术特别利用了 2 个冗余。第一个是时间冗余,第二个是空间冗余。
时间冗余注意到视频序列中的连续帧非常相似。通常,视频的速度约为每秒 20-30 帧,并且在 1/30 秒内没有太大变化。拿起任何 DVD 并将其暂停,然后将其移至一帧并注意这 2 个图像的相似程度。因此,MPEG-4(和其他压缩标准)不是独立编码每个帧,而是只编码连续帧之间的差异(使用运动估计来找到帧之间的差异)
空间冗余利用了这样一个事实,即通常在图像中分布的颜色往往是非常低的频率。我的意思是相邻像素往往具有相似的颜色。例如,在您穿着红色套头衫的图像中,代表您的套头衫的所有像素都将具有非常相似的颜色。可以使用 DCT 将像素值转换到频率空间中,在频率空间中可以丢弃一些高频信息。然后,当执行反向 DCT 时(在解码期间),图像现在没有丢弃的高频信息。
要查看丢弃高频信息的效果,请打开 MS Paint 并绘制一系列重叠的水平和垂直黑线。将图像另存为 JPEG(也使用 DCT 进行压缩)。现在放大图案,注意线条的边缘不再那么锐利并且有点模糊。这是因为在压缩过程中丢弃了一些高频信息(从黑色到白色的过渡)。阅读此内容以获得精美图片的解释
对于进一步阅读,这本书非常好,如果数学有点重。
锋利的边缘肯定包含高频。减少或消除高频会降低边缘的锐度。包括尖锐边缘在内的精细细节通过高频去除被去除 - 能够分辨 2 个小物体的能力被高频去除 - 然后你只看到一个。