6

.NET 4.5 添加了新的类来处理 zip 档案。现在您可以执行以下操作:

using (ZipArchive archive = ZipFile.OpenRead(zipFilePath))
{
    foreach (ZipArchiveEntry entry in archive.Entries)
    {
        // Extract it to the file
        entry.ExtractToFile(entry.Name);

        // or do whatever you want
        using (Stream stream = entry.Open())
        {
            ...
        }
    }
}

显然,如果您使用大型档案,可能需要几秒钟甚至几分钟才能从档案中读取文件。因此,如果您正在编写一些 GUI 应用程序(WinForms 或 WPF),您可能会在单独的线程中运行此类代码,否则您将阻塞 UI 线程并使您的应用程序用户非常沮丧。

但是这段代码中的所有 I/O 操作都将在 2016 年被认为“不酷”的阻塞模式下执行。所以有两个问题:

  1. System.IO.Compression是否可以使用类(或者可能使用其他一些第三方 .NET 库)获得异步 I/O ?
  2. 这样做有意义吗?我的意思是压缩/提取算法无论如何都非常消耗 CPU,所以如果我们甚至从CPU 密集型阻塞 I/O 到异步 I/O,性能增益可能相对较小(当然是百分比,而不是绝对值)。

更新:

回复 Peter Duniho 的回答:是的,你是对的。出于某种原因,我没有考虑过这个选项:

using (Stream zipStream = entry.Open())
using (FileStream fileStream = new FileStream(...))
{
    await zipStream.CopyToAsync(fileStream);
}

这绝对有效。谢谢!

顺便一提

await Task.Run(() => entry.ExtractToFile(entry.Name));

仍将是 CPU-bound 阻塞 I/O 操作,只是在单独的线程中在 I/O 操作期间使用线程池中的线程。

但是,正如我所看到的,.NET 的开发人员仍然使用阻塞 I/O 来进行某些存档操作(例如此代码来枚举存档中的条目,例如:dotnet@github 上的 ZipArchive.cs)。我还发现了一个关于缺少 ZipFile API 的异步 API的公开问题。

我想目前我们有部分异步支持,但还远未完成。

4

1 回答 1

9
  1. System.IO.Compression是否可以使用类(或者可能使用其他一些第三方 .NET 库)获得异步 I/O ?

根据“异步 I/O”的实际含义,您可以使用内置的 .NET 类型来实现。例如:

using (ZipArchive archive = await Task.Run(() => ZipFile.OpenRead(zipFilePath)))
{
    foreach (ZipArchiveEntry entry in archive.Entries)
    {
        // Extract it to the file
        await Task.Run(() => entry.ExtractToFile(entry.Name));

        // or do whatever you want
        using (Stream stream = entry.Open())
        {
            // use XXXAsync() methods on Stream object
            ...
        }
    }
}

如果您愿意,可以将它们包装在XXXAsync()扩展方法中。

  1. 这样做有意义吗?我的意思是压缩/提取算法无论如何都非常消耗 CPU,所以即使我们从 CPU 密集型 I/O 切换到异步 I/O,性能增益也可能相对较小(当然是百分比,而不是绝对值)。

至少有三个理由这样做:

  1. CPU 非常快。在许多情况下,I/O 仍然是瓶颈,因此异步等待 I/O 很有用。
  2. 多核 CPU 是常态。因此,让一个核心负责减压,而另一个核心负责其他工作是很有用的。
  3. 异步操作并不完全,在某些情况下根本不是关于性能的。异步处理您的档案允许用户界面保持响应,这很有用。
于 2016-09-10T00:30:53.140 回答