19

我下载了德语维基百科转储 dewiki-20151102-pages-articles-multistream.xml。我的简短问题是:在这种情况下,“多流”是什么意思?

4

2 回答 2

21

转储使用 bz2 压缩,bz2 支持并行版本,可以更快地压缩/解压缩文件。使用并行版本的压缩数据标记为multistream.

当您从编程语言处理转储时,知道这些信息会有所不同,因为您必须传递一个标志来告诉库如何解压缩它(并行或非并行)。

于 2016-03-02T12:18:55.740 回答
4

multistream允许使用索引根据需要解压缩部分,而不必解压缩整个内容。

这允许读者从压缩转储中提取文章。

于 2018-11-10T07:25:35.380 回答