8

我的应用程序将一些文件写入磁盘,但我意识到我在此过程中过度写入了现有文件。所以,我需要先检查文件是否存在,然后执行一些逻辑。

可能有很多文件,因此,我想衡量影响会产生多少开销(就时间而言)。所以,我创建了一个控制台应用程序来测试它。

我的代码

using System;
using System.Collections.Generic;
using System.IO;

namespace TimeForFileRead
{
    class Program
    {
        static string myPath = "C:\\Users\\DRook\\Desktop\\temp\\";
        static string myPathFile = myPath + "file";
        static void Main(string[] args)
        {
            for (int i = 0; i < 5; i++)
            {
                DoSomeWork();
                Console.WriteLine(" =  =  =  =  =  =============== =  =  =  =  =");
            }
            Console.ReadKey();
        }

        static void DoSomeWork()
        {
            if (!Directory.Exists(myPath))
                Directory.CreateDirectory(myPath);    

            System.Diagnostics.Stopwatch stopWatch = new System.Diagnostics.Stopwatch();

            stopWatch.Start();

            for (int i = 0; i < 1000; i++)
            {
                using (StreamWriter sw = new StreamWriter(myPathFile + i.ToString() + ".txt"))
                {
                    sw.Write(i.ToString());
                }
                i++;
            }

            stopWatch.Stop();

            Console.WriteLine("Write only: " + stopWatch.Elapsed);

            Directory.Delete(myPath, true);
            System.Threading.Thread.Sleep(500);
            Directory.CreateDirectory(myPath);
            System.Threading.Thread.Sleep(500);

            stopWatch.Reset();

            stopWatch.Start();

            for (int i = 0; i < 1000; i++)
            {
                if (!File.Exists(myPathFile + i.ToString() + ".txt"))
                {
                    using (StreamWriter sw = new StreamWriter(myPathFile + i.ToString() + ".txt"))
                    {
                        sw.Write(i.ToString());
                    }
                }
                i++;
            }
            stopWatch.Stop();
            Console.WriteLine("Write and File check: " + stopWatch.Elapsed);
        }
    }
}

因此,如您所见,它执行 2 个操作。我正在将文件写入磁盘,另一个是检查文件是否已经存在,如果不存在,则写入磁盘。

我的控制台窗口的屏幕截图(结果):

在此处输入图像描述

如您所见,奇怪的是,首先检查文件是否存在然后将其写入几乎总是比直接写入磁盘要快。这让我很困惑。这当然没有任何意义。为什么这个额外的开销会提高速度(考虑到File.Exists()在我的代码中总是会返回 false,因此不会跳过写入)?我假设我的代码有问题,但我已经看了一段时间,但我无法理解它。

编辑

根据评论,我稍微改变了顺序,所以我现在File.Exists()先执行检查,然后执行只写。结果更加夸张(尽管我现在按照上面的代码迭代超过 10000 而不是 1000):

在此处输入图像描述

编辑 2

@MatthewWatson 注意到我的代码有问题,我已对其进行了更新以确保始终首先删除目录。同样的问题仍然存在,但发生率大大降低,但速度差异更大。

using System;
using System.Collections.Generic;
using System.IO;

namespace TimeForFileRead
{
    class Program
    {
        static string myPath = "C:\\Users\\DRook\\Desktop\\temp\\";
        static string myPathFile = myPath + "file";
        static void Main(string[] args)
        {
            for (int i = 0; i < 5; i++)
            {
                DoSomeWork();
                Console.WriteLine(" =  =  =  =  =  =============== =  =  =  =  =");
            }
            Console.ReadKey();
        }

        static void DoSomeWork()
        {
            if (Directory.Exists(myPath))
                Directory.Delete(myPath, true);

            Directory.CreateDirectory(myPath);

            System.Diagnostics.Stopwatch stopWatch = new System.Diagnostics.Stopwatch();

            stopWatch.Start();

            for (int i = 0; i < 10000; i++)
            {
                using (StreamWriter sw = new StreamWriter(myPathFile + i.ToString() + ".txt"))
                {
                    sw.Write(i.ToString());

                }
                i++;
            }

            stopWatch.Stop();

            Console.WriteLine("Write  took : " + stopWatch.Elapsed);

            Directory.Delete(myPath, true);
            System.Threading.Thread.Sleep(500);
            Directory.CreateDirectory(myPath);
            System.Threading.Thread.Sleep(500);

            stopWatch.Reset();

            stopWatch.Start();

            for (int i = 0; i < 10000; i++)
            {
                if (!File.Exists(myPathFile + i.ToString() + ".txt"))
                {
                    using (StreamWriter sw = new StreamWriter(myPathFile + i.ToString() + ".txt"))
                    {
                        sw.Write(i.ToString());
                    }
                }
                i++;
            }

            stopWatch.Stop();

            Console.WriteLine("Write and check took: " + stopWatch.Elapsed);
        }
    }
}

在此处输入图像描述

4

2 回答 2

2

太多的代码不能放在评论中 - 简短的回答是 Exists + Write 通常应该比仅仅写入花费更长的时间(即使对于现有文件也是如此)。

磁盘 IO 不是很可预测(缓存、预热、机器负载、IO 队列、HDD/SSD 模型等),但是运行需要花费超过几毫秒的大量迭代(超过 1000 次)的测试应该会给你和想法。在我的机器上,Exists+Write 通常需要更长的时间,但也有例外 - 它可能是页面交换干扰或其中一个虚拟机,谁知道......

这是一个稍微修改过的测试套件,有 4 个场景: 1. 新文件夹,只写 2. 新文件夹,存在 + 写入 3. 现有文件夹和文件(来自步骤 2)只写 4. 现有文件夹和文件(来自步骤 2)存在+ 写

下面的代码:

class FTest
{
    static string myPath = "C:\\Users\\DRook\\Desktop\\temp\\";
    static string myPathFile = myPath + "file";

    public static void test()
    {
        for (int i = 0; i < 5; i++)
        {
            DoSomeWork();
            Console.WriteLine(" =  =  =  =  =  =============== =  =  =  =  =");
        }
        Console.ReadKey();
    }

    public static void testX1(string path, int index)
    {
        using (StreamWriter sw = new StreamWriter(path + index.ToString() + ".txt"))
        {
            sw.Write(index.ToString());
        }
    }

    public static void testX2(string path, int index)
    {
        if (!File.Exists(path + index.ToString() + ".txt"))
        {
            using (StreamWriter sw = new StreamWriter(path + index.ToString() + ".txt"))
            {
                sw.Write(index.ToString());
            }
        }
        else
        {
            using (StreamWriter sw = new StreamWriter(path +"n"+ index.ToString() + ".txt"))
            {
                sw.Write(index.ToString());
            }
        }
    }

    static void runTestMeasure(Action<string, int> func, int count, string message, bool cleanup)
    {
        if (cleanup)
        {
            if (Directory.Exists(myPath)) Directory.Delete(myPath, true);
            System.Threading.Thread.Sleep(500);
            Directory.CreateDirectory(myPath);
            System.Threading.Thread.Sleep(500);
        }

        System.Diagnostics.Stopwatch stopWatch = new System.Diagnostics.Stopwatch();

        stopWatch.Start();

        for (int i = 0; i < count; i++)
        {
            func(myPath,i);
        }

        stopWatch.Stop();

        Console.WriteLine(message+": " + stopWatch.Elapsed);
    }

    static void DoSomeWork()
    {
        int count = 10000;
        runTestMeasure((path, ndx) => { testX1(path, ndx); },count,"Write missing file",true);
        System.Threading.Thread.Sleep(5000);
        runTestMeasure((path, ndx) => { testX2(path, ndx); }, count, "Write+Exists missing file",true);
        System.Threading.Thread.Sleep(5000);
        runTestMeasure((path, ndx) => { testX2(path, ndx); }, count, "Write existing file", false);
        System.Threading.Thread.Sleep(5000);
        runTestMeasure((path, ndx) => { testX2(path, ndx); }, count, "Write+Exists existing file", false);
    }
}

自己检查一下,看看它在您的机器上的表现如何。顺便说一句:有i++;内部 for 循环没有意义。

编辑:如果文件存在,则修复textX2了创建新文件(备用名称)的代码

于 2013-10-29T12:33:36.977 回答
1

您的测试没有预热,并且您将 Exists 置于您的计时之外。我猜当你使用同一个文件时,它可以缓存在操作系统或硬件级别的某个地方。为了使这个测试更好:

  • 添加热身
  • 每次运行使用随机/唯一文件名
  • 使用 1000 和 10000 和 100000 个文件进行测试
  • 确保您的 gc 在每次测试开始时处于相同状态
于 2013-10-29T10:34:37.057 回答