c# - 从压缩文件中获取所有未压缩的字节

Question

我创建了一种方法，用于从压缩文件中返回所有未压缩字节。

    public static byte[] GetAllBytesFromCompressedFile(string fullPath)
    {
        const int blockSize = 10000;
        byte[] block = new byte[blockSize];
        List<byte> allBytes = new List<byte>(blockSize);

        int counter = 0;
        using (FileStream file = new FileStream(fullPath, FileMode.Open))
        {
            using (DeflateStream compress = new DeflateStream(file, CompressionMode.Decompress))
            {
                int bytesRead = 0;
                do
                {
                    bytesRead = compress.Read(block, 0, blockSize);
                    counter += bytesRead;
                    allBytes.AddRange(block);
                } while (bytesRead == blockSize);
            }
        }

        return allBytes.GetRange(0, counter).ToArray();
    }

它工作正常，但它可能会在循环中被调用数百万次。大多数文件都很小，但有些可能高达 100Mb 左右，我不想为所有小文件预分配 100Mb。所以我有几个问题：

首先，框架中是否已经有这样的方法了？或者更好的方法来做到这一点？
有没有办法获得压缩文件的未压缩大小？（这样我就不必在循环中获取块并且可以调用Read一次）
我已经使用过List<byte>，所以我不必手动重新分配字节数组。有没有更有效的附加字节的方法？

我会把我的新代码放在这里，即使它对大多数人来说可能不是一个难题。但也许有人发现了其他可以改进的地方，比如明确设置缓冲区大小（？）

    public static byte[] GetAllBytesFromCompressedFile(string fullPath)
    {
        using (MemoryStream allBytes = new MemoryStream())
        {
            using (FileStream file = new FileStream(fullPath, FileMode.Open))
            {
                using (DeflateStream compress = new DeflateStream(file, CompressionMode.Decompress))
                {
                    compress.CopyTo(allBytes);
                }
            }

            return allBytes.ToArray();
        }
    }

score 4 · Accepted Answer

首先，框架中是否已经有这样的方法了？或者更好的方法来做到这一点？

使用 aMemoryStream作为缓冲区，用于Stream.Copy将数据复制到一行中。

有没有办法获得压缩文件的未压缩大小？

不，deflate 是一种流媒体格式。您可以猜测一些值，因为未压缩的数据可能会比压缩的输入大。这样做可能是浪费时间。

我使用了 List，所以我不必手动重新分配字节数组。有没有更有效的附加字节的方法？

这是非常低效的。该类List将枚举您传入的字节数组并一一添加字节。在一个大文件上疯狂地烧 CPU。使用MemoryStream. 它用于memcpy执行其复制操作。

此外，您还有一个错误：您没有使用 Read 的返回值来确定读取了多少字节。您总是附加一个完整的缓冲区。建议的算法就会消失。

c# - 从压缩文件中获取所有未压缩的字节

1 回答 1

Related

Reference