请耐心等待,因为我没有过多地使用压缩算法,所以这对你们中的一些人来说可能很明显。当一些流媒体视频开始滞后时,我总是注意到一些事情。我只是在查看这个问题时才意识到我很好奇:
我不是在谈论像素本身,而是在谈论压缩产生的网格状布局。这表明了什么样的算法或技术?你能告诉我什么吗?
请耐心等待,因为我没有过多地使用压缩算法,所以这对你们中的一些人来说可能很明显。当一些流媒体视频开始滞后时,我总是注意到一些事情。我只是在查看这个问题时才意识到我很好奇:
我不是在谈论像素本身,而是在谈论压缩产生的网格状布局。这表明了什么样的算法或技术?你能告诉我什么吗?
看看这篇关于MPEG-2的 Wikipedia 文章。引用其中的一部分:
简而言之,原始帧被划分为 8 像素 x 8 像素块。每个块中的数据通过离散余弦变换进行变换。结果是一个 8 x 8 的系数矩阵。变换将空间变化转换为频率变化,但不会改变块中的信息;可以通过应用反余弦变换精确地重新创建原始块。
换句话说,您看到的网格状结构是这种 DCT 应用于 8x8 像素块的直接效果。
块的基本原理与位置/频率权衡有关。图像在频谱域 ( DCT )中压缩之前被划分为块,以便压缩造成的伪影更加局部化。在标准 JPEG 中,块在整个图片上的大小是恒定的。对于 JPEG2000 等较新的格式,块使用小波适应图片。我不熟悉视频格式的细节,但基本原理是一样的。
这与音频编码 (mp3) 的现象相同:不是计算整个音频文件的频谱,而是将文件拆分为几个样本的一些部分(对于 44.1 kHz 信号,通常为几百个)。同样,如果压缩数据(网络、损坏的文件)损坏,您会听到由于缺少窗口而导致的噪音。
它被称为宏块。