ffmpeg - 将 16 位灰度 PNG 转换为 HEVC/x265

Question

我想将 12 位图像信号转换为 HEVC 以进行有效压缩。因为我需要能够重建原始的 12 位信号，所以压缩需要是无损可逆的。目前我的数据是 16 位 PNG 文件。

我的第一次尝试是使用 ffmpeg：

ffmpeg -y -framerate 1 -i input.png -c:v libx265 -x265-params "lossless=1" output.mp4

不幸的是，输出是不可逆的。从 mp4 中提取图像时，像素值略有偏差。

ffmpeg -i output.mp4 -vframes 1 reconstructed.png

以下答案建议首先将输入转换为 YUV444 以避免 ffmpeg 的意外行为：无损 x264 压缩

到目前为止，我未能成功地将我的 16 位文件转换为 YUV，将其转换为 x256 并在解码时接收到正确的重建。

有没有直接的方法将 16 位图像转换为 HEVC？

score 1 · Accepted Answer

我找到了一个带有轻微舍入错误的解决方案：

编码：

基于以下帖子：如何将 png 渲染为 h.265 12 位视频？
使用可以使用以下编解码器参数：-x265-params lossless=1 -pix_fmt yuv444p12le用于有损 12 bpc 编码。
通过反复试验，我意识到 12 位数据必须在每个 16 位元素的高 12 位中。您需要将输入像素放大 16 以将数据放在高位。
（缩放 16 相当于将 uint16 元素左移 4）。
要放大像素，您可以使用colorlevels视频过滤器：
-vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625

以下命令对单个帧进行编码：

 ffmpeg -i input.png -vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625 -c:v libx265 -x265-params lossless=1 -pix_fmt yuv444p12le output.mkv

解码：

对于解码，您需要将像素除以 16 以将数据放在低 12 位中。
（除以 16 相当于将 uint16 元素右移 4）。
我找不到使用的解决方案colorlevels，所以我使用了curves过滤器：
-vf "curves=r='0/0 1.0/0.0625':g='0/0 1.0/0.0625':b='0/0 1.0/0.0625'"
16 位 PNG 的合适像素格式是rgb48be.

以下命令解码单个帧（并除以 16）：

ffmpeg -i output.mkv -vf "curves=r='0/0 1.0/0.0625':g='0/0 1.0/0.0625':b='0/0 1.0/0.0625'" -pix_fmt rgb48be reconstructed.png

差异：和
之间的最大绝对差异是级别。差异的原因可能是由于将 RGB 转换为 YUV 并返回而导致的舍入误差。input.pngreconstructed.png4

我使用以下 MATLAB 代码进行测试：

I = imread('peppers.png');

% Build 10 PNG images (used as input).
for i = 1:10
    J = insertText(I, [size(I,2)/2-18, size(I,1)/2-36], num2str(i), 'FontSize', 72);
    J = imnoise(im2double(J), 'gaussian', 0, 0.01); % Add some noise
    J = uint16(round(J*4095)); % Convert to 12 bits range (range [0, 4095])
    imwrite(J, sprintf('input%02d.png', i), 'fmt', 'png', 'BitDepth', 16, 'Mode', 'lossless'); % Write to PNG file
end

 %Encode video file using x265 codec, and 12 bits YUV444 format. 
[status, cmdout] = system('ffmpeg -y -i input%02d.png -vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625 -c:v libx265 -x265-params lossless=1 -pix_fmt yuv444p12le output.mkv');
if (status ~= 0), disp(cmdout);end

% Decode output.mkv into 10 PNG image files
[status, cmdout] = system('ffmpeg -y -i output.mkv -vf "curves=r=''0/0 1.0/0.0625'':g=''0/0 1.0/0.0625'':b=''0/0 1.0/0.0625''" -pix_fmt rgb48be reconstructed%02d.png');
if (status ~= 0), disp(cmdout);end

% Compare input and output:
for i = 1:10
    I = imread(sprintf('input%02d.png', i));
    J = imread(sprintf('reconstructed%02d.png', i));
    max_abs_diff = max(max(max(imabsdiff(I, J))));
    disp(['max_abs_diff = ', num2str(max_abs_diff)]);
end

更新：

使用灰度格式：
使用灰度时，不需要将像素格式转换为 YUV。
从灰度转换到 YUV444 会使输入数据的大小乘以 3，所以最好避免转换。

以下命令对单个灰度帧进行编码：

 ffmpeg -i input.png -vf "curves=all='0/0 0.0625/1.0'" -c:v libx265 -x265-params lossless=1 -pix_fmt gray12le -bsf:v hevc_metadata=video_full_range_flag=1 output.mkv

以下命令解码单个灰度帧（并除以 16）：

ffmpeg -i output.mkv -vf "curves=all='0/0 1.0/0.0625'" -pix_fmt gray16be reconstructed.png

最大绝对差为 2。

使用注意事项-bsf:v hevc_metadata=video_full_range_flag=1：

在 H.265 中，Y 颜色通道的默认范围是“有限范围”。
对于 8 位，“有限范围”适用 [16, 235]。
对于 12 位，“有限范围”适用 [256, 3760]。
当使用“全范围”[0, 255] 为 8 位或 [0, 4095] 为 12 位时，您需要在流的元数据中指定它。
使用 FFmpeg 设置元数据的方法是使用比特流过滤器。

score 0 · Accepted Answer

我试图为灰度 10 位数据实现相同的目标。

感谢ffmpeg-user 邮件列表上的 Paul B Mahol ，我已经能够通过使用临时 rawvideo 文件并欺骗 rawvideo 解复用器以我想要的位深度解释文件来解决剩余的舍入错误。

我假设相同的解决方案适用于 12 位数据，并且可以扩展到 RGB 数据。ffmpeg 命令行可以在我的相关（几乎重复）问题中找到： https ://stackoverflow.com/a/69874453/17261462

ffmpeg - 将 16 位灰度 PNG 转换为 HEVC/x265

2 回答 2

更新：

Related

Reference