23

我想知道 Linq 扩展方法是否是原子的?或者我是否需要在任何类型的迭代之前跨线程使用lock任何对象?IEnumerable

将变量声明为volatile对此有任何影响吗?

综上所述,以下哪个是最好的、线程安全的操作?

1-没有任何锁:

IEnumerable<T> _objs = //...
var foo = _objs.FirstOrDefault(t => // some condition

2-包括锁定语句:

IEnumerable<T> _objs = //...
lock(_objs)
{
    var foo = _objs.FirstOrDefault(t => // some condition
}

3- 将变量声明为 volatile:

volatile IEnumerable<T> _objs = //...
var foo = _objs.FirstOrDefault(t => // some condition
4

3 回答 3

24

该接口IEnumerable<T>不是线程安全的。请参阅http://msdn.microsoft.com/en-us/library/s793z9y2.aspx上的文档,其中指出:

只要集合保持不变,枚举数就保持有效。如果对集合进行了更改,例如添加、修改或删除元素,则枚举器将不可恢复地失效,并且其行为未定义。

枚举器没有对集合的独占访问权;因此,通过集合进行枚举本质上不是线程安全的过程。为了保证枚举过程中的线程安全,可以在整个枚举过程中锁定集合。要允许集合被多个线程访问以进行读写,您必须实现自己的同步。

Linq 不会改变这一切。

锁定显然可以用来同步对对象的访问。但是,您必须在访问它的任何地方锁定对象,而不仅仅是在迭代它时。

将集合声明为 volatile 不会产生积极影响。它只会在读取之前和写入对集合的引用之后导致内存屏障。它不同步集合读取或写入。

于 2012-06-19T15:06:37.447 回答
10

简而言之,它们不是如上所述的线程安全的。

但是,这并不意味着您必须在“每种迭代”之前锁定。

您需要将所有更改集合的操作(添加、修改或删除元素)与其他操作(添加、修改、删除元素或读取元素)同步。

如果您只是同时对集合执行读取操作,则不需要锁定。(所以一起运行 LINQ 命令,如 Average、Contains、ElementAtOrDefault 就可以了)

如果集合中的元素是机器字长,例如大多数 32 位计算机上的 Int,那么更改该元素的值已经是原子执行的。在这种情况下,不要在没有锁定的情况下从集合中添加或删除元素,但是如果您可以处理设计中的一些不确定性,修改值可能是可以的。

最后,您可以考虑对集合的单个元素或部分进行细粒度锁定,而不是锁定整个集合。

于 2012-06-20T20:45:26.593 回答
-1

这是一个证明IEnumerable扩展方法不是线程安全的示例。在我的机器上,throw new Exception("BOOM");线路总是在几秒钟内响起。

希望我已经很好地记录了代码以解释如何触发线程问题。

您可以在linqpad中运行此代码以亲自查看。

async Task Main()
{
    // The theory is that it will take a longer time to query a lot of items
    // so there should be a better chance that we'll trigger the problem. 
    var listSize = 999999;
    
    // Specifies how many tasks to spin up. This doesn't necessarily mean
    // that it'll spin up the same number of threads, as we're using the thread
    // pool to manage that stuff. 
    var taskCount = 9999;

    // We need a list of things to query, but the example here is a bit contrived. 
    // I'm only calling it `ages` to have a somewhat meaningful variable name. 
    // This is a distinct list of ints, so, ideally, a filter like:
    // `ages.Where(p => p == 4` should only return one result. 
    // As we'll see below, that's not always the case. 
    var ages = Enumerable
        .Range(0, listSize)
        .ToList();
    
    // We'll use `rand` to find a random age in the list. 
    var rand = new Random();
    
    // We need a reference object to prove that `.Where(...)` below isn't thread safe. 
    // Each thread is going to modify this shared `person` property in parallel. 
    var person = new Person();
    
    // Start a bunch of tasks that we'll wait on later. This will run as parallel
    // as your machine will allow. 
    var tasks = Enumerable
        .Range(0, taskCount)
        .Select(p => Task.Run(() =>
        {
            // Pick a random age from the list. 
            var age = ages[rand.Next(0, listSize)];
            
            // These next two lines are where the problem exists. 
            // We've got multiple threads changing `person.Age` and querying on `person.Age` 
            // at the same time. As one thread is looping through the `ages` collection
            // looking for the `person.Age` value that we're setting here, some other
            // thread is going to modify `person.Age`. And every so often, that will
            // cause the `.Where(...)` clause to find multiple values. 
            person.Age = age;
            var count = ages.Where(a => a == person.Age).Count();

            // Throw an exception if the `.Where(...)` filter returned more than one age. 
            if (count > 1) {
                throw new Exception("BOOM");
            }
        }));
        
    await Task.WhenAll(tasks);
    
    Console.WriteLine("Done");
}

class Person {
    public int Age { get; set; }
}
于 2021-06-25T13:53:36.467 回答