4

我试图了解块大小的影响以及在 DCT 压缩中选择系数的最佳策略。基本上我想问我在这里写了什么:

视频压缩:什么是离散余弦变换?

让我们假设最原始的压缩。制作图像块。在每个博客上执行 DCT 并将一些系数归零。

据我了解,块越小越好。较小的块意味着像素更相关,因此 DCT 光谱中的能量更“紧凑”。在快速变化的图像(高频)中应该更加强调它。

假设我们将一定百分比的系数归零,什么会产生最佳图像质量,小块还是大块?假设我们保留 10%、25%、50%、75%,你会说这是不同百分比的不同答案吗?

另一个问题是如何选择你保持不变的系数。免得说我必须根据位置而不是能量做出决定。你会从左上角取一个正方形吗?我已经平均了 DCT 频谱中的许多块,并得出最好的结论是从左上角取一个三角形。你怎么看?

希望我们能进行有效的讨论。

4

1 回答 1

9

您问题的本质似乎与图像质量有关。关于这个主题已经产生了大量的文献,结果是图像质量很难确定。

标准的数学误差测量,如信噪比 (SNR) 和均方误差 (MSE) 可以给出定量的答案,但众所周知,这些与主观观众的意见没有很好的相关性,这一定是我们的最终权威。没有其他方法,即使是基于观看者的心理视觉模型的方法(例如,SA Karunasekera 和 NG Kingsbury,“基于人类视觉敏感性的图像中块伪影的失真测量”,IEEE Trans. on Image Proc. vol. 4 ,第 6 期,1995 年 6 月,第 713 –724 页;以及 M. Miyahara、K. Kotani 和 VR Algazi,“用于图像编码的客观图像质量量表 (PQS)”,IEEE Trans. on Comm. vol. 46, no. 9, Sept. 1998, pp. 1215 –1226),已经证明自己比 SNR 更好。

此外,当您改变图像类型(线条画、卡通、照片、肖像等)时,某些类型的压缩失真会变得更加明显。蚊子噪声可能在一张图像中令人反感,而楼梯噪声可能是另一张图像的罪魁祸首。

简而言之,对于您的问题,“什么会产生最佳图像质量?”没有一个简单的答案。

话虽如此,我们可以说一些有关 DCT 的相关内容。块的 DCT 中的像素从左上角以锯齿形图案从低变化到高变化 [(0,0)->(0,1)->(1,0)->(2 ,0)->(1,1)->(0,2)->etc.],作为您的三角形选择镜像。一个像素离左上角越近,其中包含的信息就越平滑[其实,(0,0) DCT值是整个块的平均值],离那个角越远,越您将获得“高频”细节。越靠近图像的顶部和左侧,DCT 系数代表的水平和垂直细节就越多,越靠近块的对角线,对角线的细节就越多。

简而言之,有损压缩通常需要丢弃一些肉眼无法察觉的“细节”。(丢弃“更平滑”的 DCT 值会导致严重失真。)丢弃的 DCT 值越多,压缩比就越大,但也会引起更大的失真。

至于块大小,这完全取决于。块中的方差和细节越多,丢弃系数的损失就越大。一些压缩算法自适应地在同一图像中使用不同的块大小,以便高细节区域接收更多和更小的块,而平滑区域接收更少和更大的块。

对于使用单个块大小的算法,8x8、16x16 和 32x32 对于 JPEG 和 MPEG 等内容很常见。压缩它们所需的处理将小于自适应块大小,但质量通常也会较低。

于 2009-12-24T15:56:17.763 回答