4

我在涉足多线程时遇到了一个绊脚石。我想我知道问题是什么,但无法确定如何解决它。但我可能错了。

总之,我有生产者和消费者线程。生产者线程将来自外部源的数据收集到数据表中,然后将它们放入集合中。消费者然后从集合中获取数据表。我将 BlockingCollection 用作公共静态集合,以便两个线程都可以访问它,这两个线程存在于两个不同的类中。我现在将展示代码的主要部分,然后解释什么是有效的,什么是无效的。

生产者线程:

try
{
     dataTable.Clear();
     adapter.Fill(dataTable);
     dataCaptured = true;
     timeout = 0;
     ThreadInfo.setCurrentDate(startDate);
     ThreadInfo.dataTableCollection.Add(dataTable);
}

消费者线程

while(true)
{
     DataTable testTable = ThreadInfo.dataTableCollection.Take();
     foreach (DataRow datarow in testTable.Rows)
     {
          foreach (var item in datarow.ItemArray)
          {
                Console.WriteLine(item);
          }
     }
}

所以我的测试表明,当生产者线程创建数据表时,它成功地将它们添加到集合中。我可以通过在 add 方法之前和之后使用 count 来看到这一点。计算每个表中的行数,我还可以确认添加的表与创建的表相同。此外,take 方法还成功删除了一个表,并且该表与输入的表相匹配。我通过计算集合中的表数和计算“采取”数据表中的行数都知道这一点。

我的问题是当我尝试运行 foreach 循环以打印出结果时。最初它工作并开始将数据打印到屏幕上,但随后抛出此错误:

System.InvalidOperationException was unhandled
  HResult=-2146233079
  Message=Collection was modified; enumeration operation might not execute.
  Source=System.Data
  StackTrace:
       at System.Data.RBTree`1.RBTreeEnumerator.MoveNext()
       at pullPlexTable.InputThreads.dataConsumerThread() in \\srv-file01\users$\dkb\Visual Studio 2013\Projects\pullPlexTable\pullPlexTable\InputThread.cs:line 39
       at System.Threading.ThreadHelper.ThreadStart_Context(Object state)
       at System.Threading.ExecutionContext.RunInternal(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
       at System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
       at System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
       at System.Threading.ThreadHelper.ThreadStart()
  InnerException:

我相信这似乎发生在将新数据表添加到集合中时。我相信这得到了错误的支持,该错误表明 .movenext() 遇到了错误,这意味着它正试图移动到集合中的下一个值?

但我真的不知道该怎么做,即使我是对的。我试过复制数据表,但仍然遇到和错误。我原以为一旦它创建了一个数据表并使用集合中的 take 方法复制了数据表,我就可以随意迭代它。我的直觉是数据表仍然指向集合中的数据表,当新数据表进入时它会被撞倒,它会引发错误。但这是完全的猜测,可能完全错误。任何人都可以帮忙吗?

如果您需要更多信息,我很乐意发布。

4

1 回答 1

5

DataTable您每次都需要创建一个新的- 它们是可变的,并且通过引用传递。

到目前为止,您所做的是使引用本身成为线程安全的。但这还不够——所有线程仍然共享同一个DataTable.

相反,生产者可能看起来像这样:

 var dt = new DataTable();
 adapter.Fill(dt);

 ThreadInfo.dataTableCollection.Add(dt);

我已经删除了你周围的其他东西,因为这很可能也是错误的——你在线程间共享的任何资源都必须是线程安全的或同步的。最简单的方法是确保您只能在 a 内读取和写入它们lock,显式同步访问:

private static object syncObject = new object();

private static DateTime currentDate;
public static DateTime CurrentDate
{
  get { lock (syncObject) return currentDate; }
  set { lock (syncObject) currentDate = value; }
}

这些只是最基本的。您真的不想在多线程环境中四处猜测。多线程很难。至少,我建议您通过出色的http://www.albahari.com/threading/ - 它会教您基本概念。和谦虚:D

确保安全多线程的最简单方法是确保您永远不会static在线程之间传递任何可变对象——当然,使用s;很难确保这一点;一个好的准则是默认情况下任何public static成员都必须是线程安全的。如果您只Task使用给定的(不可变的或非共享的)参数运行新的,并使用返回值,那么多线程会变得容易得多。

对于生产者-消费者队列,确保传递不可变数据或不打算重用的数据(例如,“新数据表,填充它,传递它,忘记它”方法)。如果您需要任何自身未提供的信号BlockingCollection,请确保它是线程安全的。理想情况下,您希望尽可能使用高级构造 - CancellationToken,TaskManualResetEvent- 请参阅上面的链接。如果您使用按值类型(一直向下 - 将引用包装在结构中显然对您没有帮助),它将为您节省很多麻烦,但即使那样,您也需要锁定阅读和写作。

于 2015-04-20T08:45:51.920 回答