0

我正在尝试解压缩从此处下载的 WARC ZST 文件:https ://archive.org/details/archiveteam_yahooanswers_20210422220546_c4fac540

我尝试了该命令zstd -d yahooanswers_20210422220546_c4fac540.1619026173.megawarc.warc.zst,但出现此错误: 73.megawarc.warc.zst : 0 MB... 73.megawarc.warc.zst : Decoding error (36) : Dictionary mismatch 如何找到所述字典或有任何替代方法吗?

4

1 回答 1

1

该字典可以在 warc 的第一个可跳过帧内找到。

要提取字典 OrIdow6 写这个来提取它:https ://transfer.notkiska.pw/inline/TXlRo/xtract.py

你需要 python3、zstd 和 zstandard

python ./xtract.py /path/to/megawarc.warc.zst > dict

那么你也能

zstd -d /path/to/megawarc.warc.zst -D dict

您应该能够使用标准的 Warc 查看工具查看 megawarc

于 2021-07-13T18:53:11.540 回答