0

第一个函数旨在使 linq 能够安全地并行执行 lambda 函数(甚至是 async void 函数)。

所以你可以做 collection.AsParallel().ForAllASync(async x => await x.Action)。

第二个函数旨在使您能够并行组合和执行多个 IAsyncEnumerables 并尽快返回它们的结果。

我有以下代码:

    public static async Task ForAllAsync<TSource>(
        this ParallelQuery<TSource> source, 
        Func<TSource, Task> selector,
        int? maxDegreeOfParallelism = null)
    {
        int maxAsyncThreadCount = maxDegreeOfParallelism ?? Math.Min(System.Environment.ProcessorCount, 128);
        using SemaphoreSlim throttler = new SemaphoreSlim(maxAsyncThreadCount, maxAsyncThreadCount);

        IEnumerable<Task> tasks = source.Select(async input =>
        {
            await throttler.WaitAsync().ConfigureAwait(false);
            
            try
            {
                await selector(input).ConfigureAwait(false);
            }
            finally
            {
                throttler.Release();
            }
        });

        await Task.WhenAll(tasks).ConfigureAwait(true);
    }

    public static async IAsyncEnumerable<T> ForAllAsync<TSource, T>(
        this ParallelQuery<TSource> source,
        Func<TSource, IAsyncEnumerable<T>> selector,
        int? maxDegreeOfParallelism = null,
        [EnumeratorCancellation]CancellationToken cancellationToken = default) 
        where T : new()
    {
        IEnumerable<(IAsyncEnumerator<T>, bool)> enumerators = 
            source.Select(x => (selector.Invoke(x).GetAsyncEnumerator(cancellationToken), true)).ToList();

        while (enumerators.Any())
        {
            await enumerators.AsParallel()
                .ForAllAsync(async e => e.Item2 = (await e.Item1.MoveNextAsync()), maxDegreeOfParallelism)
                .ConfigureAwait(false);
            foreach (var enumerator in enumerators)
            {
                yield return enumerator.Item1.Current;
            }
            enumerators = enumerators.Where(e => e.Item2);
        }
    }

如果我从第二个函数中删除“ToList()”,尽管 enumerator.Item2(MoveNextAsync() 的结果)为真,但由于 enumerator.Item1.Current 往往为空,yield return 开始返回 null。

为什么?

4

1 回答 1

3

这是一个典型的延期执行案例。每次您在非物化对象上调用评估方法时IEnumerable<>,它都会执行物化 IEnumerable 的工作。在这种情况下,它会重新调用您的选择器并创建等待 GetAsyncEnumerator 调用的任务的新实例。

通过调用.ToList()您实现 IEnumerable。没有它,每次调用.Any()、 调用ForAllAsync()foreach循环都会发生物化。

可以像这样最少地复制相同的行为:

var enumerable = new[] { 1 }.Select(_ => Task.Delay(10));
await Task.WhenAll(enumerable);
Console.WriteLine(enumerable.First().IsCompleted); // False
enumerable = enumerable.ToList();
await Task.WhenAll(enumerable);
Console.WriteLine(enumerable.First().IsCompleted); // True

在第一次调用 时enumerable.First(),我们最终得到了一个与我们在它之前的行中等待的不同的任务实例。

在第二次调用中,我们使用了相同的实例,因为 Task 已经具体化为 List。

于 2021-04-21T15:21:33.223 回答