31

我正在使用并发字典作为线程安全的静态缓存,并注意到以下行为:

来自GetOrAdd 上的 MSDN 文档

如果您在不同的线程上同时调用 GetOrAdd,则 addValueFactory 可能会被多次调用,但它的键/值对可能不会在每次调用时都添加到字典中。

我希望能够保证工厂只被调用一次。有没有什么方法可以用 ConcurrentDictionary API 做到这一点,而无需借助我自己的单独同步(例如锁定在 valueFactory 内)?

我的用例是 valueFactory 在动态模块中生成类型,因此如果同一键的两个 valueFactories 同时运行,我会点击:

System.ArgumentException: Duplicate type name within an assembly.

4

2 回答 2

44

您可以使用这样键入的字典:ConcurrentDictionary<TKey, Lazy<TValue>>,然后您的值工厂将返回一个Lazy<TValue>已使用 初始化的对象,如果您未指定它LazyThreadSafetyMode.ExecutionAndPublication,这是使用的默认选项。Lazy<TValue>通过指定LazyThreadSafetyMode.ExecutionAndPublication你告诉 Lazy 只有一个线程可以初始化和设置对象的值。

这导致ConcurrentDictionary只使用一个对象实例Lazy<TValue>,并且该Lazy<TValue>对象保护多个线程免于初始化其值。

IE

var dict = new ConcurrentDictionary<int, Lazy<Foo>>();
dict.GetOrAdd(key,  
    (k) => new Lazy<Foo>(valueFactory)
);

缺点是每次访问字典中的对象时都需要调用 *.Value 。以下是一些有助于解决此问题的扩展。

public static class ConcurrentDictionaryExtensions
{
    public static TValue GetOrAdd<TKey, TValue>(
        this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
        TKey key, Func<TKey, TValue> valueFactory
    )
    {
        return @this.GetOrAdd(key,
            (k) => new Lazy<TValue>(() => valueFactory(k))
        ).Value;
    }

    public static TValue AddOrUpdate<TKey, TValue>(
        this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
        TKey key, Func<TKey, TValue> addValueFactory,
        Func<TKey, TValue, TValue> updateValueFactory
    )
    {
        return @this.AddOrUpdate(key,
            (k) => new Lazy<TValue>(() => addValueFactory(k)),
            (k, currentValue) => new Lazy<TValue>(
                () => updateValueFactory(k, currentValue.Value)
            )
        ).Value;
    }

    public static bool TryGetValue<TKey, TValue>(
        this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
        TKey key, out TValue value
    )
    {
        value = default(TValue);

        var result = @this.TryGetValue(key, out Lazy<TValue> v);

        if (result) value = v.Value;

        return result;
   }

   // this overload may not make sense to use when you want to avoid
   //  the construction of the value when it isn't needed
   public static bool TryAdd<TKey, TValue>(
       this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
       TKey key, TValue value
   )
   {
       return @this.TryAdd(key, new Lazy<TValue>(() => value));
   }

   public static bool TryAdd<TKey, TValue>(
       this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
       TKey key, Func<TKey, TValue> valueFactory
   )
   {
       return @this.TryAdd(key,
           new Lazy<TValue>(() => valueFactory(key))
       );
   }

   public static bool TryRemove<TKey, TValue>(
       this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
       TKey key, out TValue value
   )
   {
       value = default(TValue);

       if (@this.TryRemove(key, out Lazy<TValue> v))
       {
           value = v.Value;
           return true;
       }
       return false;
   }

   public static bool TryUpdate<TKey, TValue>(
       this ConcurrentDictionary<TKey, Lazy<TValue>> @this,
       TKey key, Func<TKey, TValue, TValue> updateValueFactory
   )
   {
       if (!@this.TryGetValue(key, out Lazy<TValue> existingValue))
           return false;

       return @this.TryUpdate(key,
           new Lazy<TValue>(
               () => updateValueFactory(key, existingValue.Value)
           ),
           existingValue
       );
   }
}
于 2012-09-26T22:21:06.453 回答
6

这在非阻塞算法中并不少见。他们基本上测试了一个条件,确认没有使用Interlock.CompareExchange. 他们循环直到CAS成功。看看第 (4) 页作为非阻塞算法ConcurrentQueue的一个很好的介绍

简短的回答是否定的,这是野兽的本性,它需要多次尝试才能添加到争用的集合中。除了使用传递值的其他重载之外,您还需要防止值工厂内的多次调用,可能使用双锁/内存屏障

于 2012-09-26T22:16:43.643 回答