image-processing - DCT 压缩 - 块大小，选择系数

Question

我试图了解块大小的影响以及在 DCT 压缩中选择系数的最佳策略。基本上我想问我在这里写了什么：

视频压缩：什么是离散余弦变换？

让我们假设最原始的压缩。制作图像块。在每个博客上执行 DCT 并将一些系数归零。

据我了解，块越小越好。较小的块意味着像素更相关，因此 DCT 光谱中的能量更“紧凑”。在快速变化的图像（高频）中应该更加强调它。

假设我们将一定百分比的系数归零，什么会产生最佳图像质量，小块还是大块？假设我们保留 10%、25%、50%、75%，你会说这是不同百分比的不同答案吗？

另一个问题是如何选择你保持不变的系数。免得说我必须根据位置而不是能量做出决定。你会从左上角取一个正方形吗？我已经平均了 DCT 频谱中的许多块，并得出最好的结论是从左上角取一个三角形。你怎么看？

希望我们能进行有效的讨论。

score 9 · Accepted Answer

您问题的本质似乎与图像质量有关。关于这个主题已经产生了大量的文献，结果是图像质量很难确定。

标准的数学误差测量，如信噪比 (SNR) 和均方误差 (MSE) 可以给出定量的答案，但众所周知，这些与主观观众的意见没有很好的相关性，这一定是我们的最终权威。没有其他方法，即使是基于观看者的心理视觉模型的方法（例如，SA Karunasekera 和 NG Kingsbury，“基于人类视觉敏感性的图像中块伪影的失真测量”，IEEE Trans. on Image Proc. vol. 4 ，第 6 期，1995 年 6 月，第 713 –724 页；以及 M. Miyahara、K. Kotani 和 VR Algazi，“用于图像编码的客观图像质量量表 (PQS)”，IEEE Trans. on Comm. vol. 46， no. 9, Sept. 1998, pp. 1215 –1226)，已经证明自己比 SNR 更好。

此外，当您改变图像类型（线条画、卡通、照片、肖像等）时，某些类型的压缩失真会变得更加明显。蚊子噪声可能在一张图像中令人反感，而楼梯噪声可能是另一张图像的罪魁祸首。

简而言之，对于您的问题，“什么会产生最佳图像质量？”没有一个简单的答案。

话虽如此，我们可以说一些有关 DCT 的相关内容。块的 DCT 中的像素从左上角以锯齿形图案从低变化到高变化 [(0,0)->(0,1)->(1,0)->(2 ,0)->(1,1)->(0,2)->etc.]，作为您的三角形选择镜像。一个像素离左上角越近，其中包含的信息就越平滑[其实，(0,0) DCT值是整个块的平均值]，离那个角越远，越您将获得“高频”细节。越靠近图像的顶部和左侧，DCT 系数代表的水平和垂直细节就越多，越靠近块的对角线，对角线的细节就越多。

简而言之，有损压缩通常需要丢弃一些肉眼无法察觉的“细节”。（丢弃“更平滑”的 DCT 值会导致严重失真。）丢弃的 DCT 值越多，压缩比就越大，但也会引起更大的失真。

至于块大小，这完全取决于。块中的方差和细节越多，丢弃系数的损失就越大。一些压缩算法自适应地在同一图像中使用不同的块大小，以便高细节区域接收更多和更小的块，而平滑区域接收更少和更大的块。

对于使用单个块大小的算法，8x8、16x16 和 32x32 对于 JPEG 和 MPEG 等内容很常见。压缩它们所需的处理将小于自适应块大小，但质量通常也会较低。

image-processing - DCT 压缩 - 块大小，选择系数

1 回答 1

Related

Reference