1

我目前正在使用 .net 4.0 和 winforms 构建一个与服务器相关的小型应用程序。我想利用任务并行库的优势,但我对这里的最佳或“正确”实现有点动摇。

目的:

  1. 使用正则表达式模式从网络路径使用文件(每 15 分钟使用一次。)
  2. 读取文件(csv 样式)
  3. 重写文件以跳过某些列
  4. 通过批量插入或更新将文件数据传输到 sql server

我正在考虑一种级联方法,如下所示:

ProducerConsumerTask1(从网络路径获取文件/使文件可读取)
ProducerConsumerTask2(从Task1读取文件/从Task1重写文件)
ProducerConsumerTask3(获取重写文件/将文件从Task2传输到DB)

还有一点代码:

private static BlockingCollection<ManagedFile> searchQueue = new BlockingCollection<ManagedFile>(limit);
private const int limit = 100;

public void StartFileTask()
{
    Task[] producers = new Task[1];
    producers[0] = Task.Factory.StartNew(() => ProduceFileSearchTask());


    Task.Factory.StartNew(() => ConsumeFileSearchTask());
}

public static void ProduceFileSearchTask()
{
    var pattern = new Regex(Properties.Settings.Default.DefaultRegexPattern);
    string path = Properties.Settings.Default.DefaultImportPath;

    IEnumerable<FileInfo> files = new DirectoryInfo(path)
                                        .EnumerateFiles("*.*", SearchOption.AllDirectories)
                                        .Where(x => pattern.IsMatch(x.Name));

    for (int i = 0; i < files.ToList().Count(); i++)
    {
        ManagedFile _managedFile = new ManagedFile();
        _managedFile.Id = Guid.NewGuid();
        _managedFile.ManagedFileName = files.ElementAt(i).FullName;
        _managedFile.ManagedFileAddedOn = DateTime.Now;

        if (!searchQueue.IsAddingCompleted)
            searchQueue.Add(_managedFile);

        Thread.SpinWait(100000); 
    }           
}

public static void ConsumeFileSearchTask()
{
    foreach (var item in searchQueue.GetConsumingEnumerable())
    {
        // use ProducerTask for Reading the Files here
    }
}

如果有人分享他对这个想法的想法,那就太好了。这是一个很好的处理方式吗?在这种情况下有什么更好的办法?这种情况下的另一个主题:ui自动化/报告/状态更新到ui怎么样?如何才能做到这一点?活动/代表,嗯?

谢谢!

4

1 回答 1

1

添加我的评论作为答案:)

这看起来像是使用 Tasks.Dataflow 的完美场景。看看这个,它可能对你有很大帮助:Tasks.DataFlow 白皮书

另一种建议的方法:一个任务读取新文件并将其中一些文件放入 BlockingCollection(又名生产者-消费者)。消费者任务维护并发任务列表并从集合中读取以安排新任务。通过调整消费者任务以及它可以同时跟踪多少个文件,您可以检查您的性能。一旦消费者收到某个任务完成的通知,再次从生产者那里读取并安排另一个任务。它们将独立并行。

另一个要查看的框架是 Reactive Extensions 并将您的源转换为可观察的文件集合并在其中应用节流。

于 2012-08-27T15:21:07.283 回答