3

我有一个从多个线程访问的类的实例。此类接受此调用并将元组添加到数据库中。我需要以串行方式完成此操作,因为由于某些数据库限制,并行线程可能会导致数据库不一致。

由于我对 C# 中的并行性和并发性不熟悉,所以我这样做了:

private BlockingCollection<Task> _tasks = new BlockingCollection<Task>();

public void AddDData(string info)
{
    Task t = new Task(() => { InsertDataIntoBase(info); });
    _tasks.Add(t);
}

private void InsertWorker()
{
    Task.Factory.StartNew(() =>
    {
        while (!_tasks.IsCompleted)
        {
            Task t;
            if (_tasks.TryTake(out t))
            {
                t.Start();
                t.Wait();
            }
        }
    });
}

AddDData是由多个线程调用的,InsertDataIntoBase是一个非常简单的插入,应该需要几毫秒。

问题是,由于某种原因,我缺乏知识,无法弄清楚,有时一个任务被调用了两次!它总是这样:

T1 T2 T3 T1 <- PK 错误。T4 ...

我是不是.Take()完全理解错了,是我遗漏了什么,还是我的生产者/消费者实现真的很糟糕?

最好的问候, 拉斐尔

更新:

正如建议的那样,我用这个架构做了一个快速的沙盒测试实现,正如我所怀疑的那样,它并不能保证在前一个任务完成之前不会触发任务。

在此处输入图像描述

所以问题仍然存在:如何正确地对任务进行排队并按顺序触发它们?

更新 2:

我简化了代码:

private BlockingCollection<Data> _tasks = new BlockingCollection<Data>();

public void AddDData(Data info)
{
    _tasks.Add(info);
}

private void InsertWorker()
{
    Task.Factory.StartNew(() =>
    {
        while (!_tasks.IsCompleted)
        {
            Data info;
            if (_tasks.TryTake(out info))
            {
                InsertIntoDB(info);
            }
        }
    });
}

请注意,我摆脱了任务,因为我依赖于同步的 InsertIntoDB 调用(因为它在循环内),但仍然没有运气......一代很好,我绝对确定只有唯一的实例会去队列。但无论我怎么尝试,有时同一个对象会被使用两次。

4

3 回答 3

1

我认为这应该有效:

    private static BlockingCollection<string> _itemsToProcess = new BlockingCollection<string>();

    static void Main(string[] args)
    {
        InsertWorker();
        GenerateItems(10, 1000);
        _itemsToProcess.CompleteAdding();
    }

    private static void InsertWorker()
    {
        Task.Factory.StartNew(() =>
        {
            while (!_itemsToProcess.IsCompleted)
            {
                string t;
                if (_itemsToProcess.TryTake(out t))
                {
                    // Do whatever needs doing here
                    // Order should be guaranteed since BlockingCollection 
                    // uses a ConcurrentQueue as a backing store by default.
                    // http://msdn.microsoft.com/en-us/library/dd287184.aspx#remarksToggle
                    Console.WriteLine(t);
                }
            }
        });
    }

    private static void GenerateItems(int count, int maxDelayInMs)
    {
        Random r = new Random();
        string[] items = new string[count];

        for (int i = 0; i < count; i++)
        {
            items[i] = i.ToString();
        }

        // Simulate many threads adding items to the collection
        items
            .AsParallel()
            .WithDegreeOfParallelism(4)
            .WithExecutionMode(ParallelExecutionMode.ForceParallelism)
            .Select((x) =>
            {
                Thread.Sleep(r.Next(maxDelayInMs));
                _itemsToProcess.Add(x);
                return x;
            }).ToList();
    }

这确实意味着消费者是单线程的,但允许多个生产者线程。

于 2013-09-11T20:29:34.427 回答
0

从你的评论

“我简化了此处显示的代码,因为数据不是字符串”

我假设info传递给 AddDData 的参数是可变引用类型。确保调用者没有对多个调用使用相同的info实例,因为该引用是在 Task lambda 中捕获的。

于 2013-09-11T19:52:40.273 回答
0

根据您提供的跟踪,唯一合乎逻辑的可能性是您调用InsertWorker了两次(或更多)。因此,有两个后台线程等待项目出现在集合中,有时它们都设法抓住一个项目并开始执行它。

于 2013-09-12T06:23:47.593 回答