2

我试图阻止RequestHandler.ParseAll()await ConsumerTask;但是当我在那里设置断点时,我总是先得到“完成......”输出......然后Parse2()失败并出现 NullReferenceException。(这是我的猜测:“GC 开始清理,因为_handler超出了范围”)

无论如何,我无法弄清楚为什么会发生这种情况。

class MainClass
{
    public async void DoWork()
    {
        RequestHandler _handler = new RequestHandler();
        string[] mUrls;
        /* fill mUrls here with values */
        await Task.Run(() => _handler.ParseSpecific(mUrls));
        Console.WriteLine("Done...");
    }
}
static class Parser
{
    public static async Task<IEnumerable<string>> QueryWebPage(string url) { /*Query the url*/ }

    public static async Task Parse1(Query query) 
    { 
        Parallel.ForEach(/*Process data here*/);
    }

    public static async Task Parse2(Query query)
    {
        foreach(string line in query.WebPage)
            /* Here i get a NullReference exception because query.WebPage == null */
    }
}
sealed class RequestHandler
{
    private BlockingCollection<Query> Queue;
    private Task ConsumerTask = Task.Run(() => /* call consume() for each elem in the queue*/);

    private async void Consume(Query obj)
    {
        await (obj.BoolField ? Parser.Parse1(obj) : Parser.Parse2(obj));
    }

    public async void ParseSpecific(string[] urls)
    {
        foreach(string v in urls)
            Queue.Add(new Query(await QueryWebPage(v), BoolField: false));

        Queue.CompleteAdding();
        await ConsumerTask;
        await ParseAll(true);
    }

    private async Task ParseAll(bool onlySome)
    {
        ReInit();
        Parallel.ForEach(mCollection, v => Queue.Add(new Query(url, BoolField:false)));
        Queue.CompleteAdding();
        await ConsumerTask;
        /* Process stuff further */
    }
}
struct Query
{
    public readonly string[] WebPage;
    public readonly bool BoolField;
    public Query(uint e, IEnumerable<string> page, bool b) : this()
    {
        Webpage = page.ToArray();
        BoolField = b;
    }
}
4

1 回答 1

6

CodesInChaos 在评论中发现了这个问题。它源于异步方法返回void,您几乎应该这样做 - 这意味着您无法跟踪它们。

相反,如果您的异步方法没有任何实际值要返回,您应该让它们返回Task

发生的事情是,ParseSpecific它只同步运行,直到第一个await QueryWebPage(v)没有立即完成。然后它返回......所以任务从这里开始:

await Task.Run(() => _handler.ParseSpecific(mUrls));

... 立即完成,并打印“完成”。

一旦你让所有异步方法返回Task,你就可以等待它们。你也根本不需要Task.Run。所以你会有:

public async void DoWork()
{
    RequestHandler _handler = new RequestHandler();
    string[] mUrls;
    await _handler.ParseSpecific(mUrls);
    Console.WriteLine("Done...");
}

...

public async TaskParseSpecific(string[] urls)
{
    foreach(string v in urls)
    {
        // Refactored for readability, although I'm not sure it really
        // makes sense now that it's clearer! Are you sure this is what
        // you want?
        var page = await QueryWebPage(v);
        Queue.Add(new Query(page, false);
    }

    Queue.CompleteAdding();
    await ConsumerTask;
    await ParseAll(true);
}

您的Reinit方法也需要更改,因为目前该方法ConsumerTask基本上Consume会立即完成,因为它是另一个返回 void 的异步方法将立即返回。

老实说,如果没有正确理解 async/await,你所得到的看起来非常复杂。我会阅读更多关于 async/await 的内容,然后可能从头开始。我强烈怀疑您可以使这变得非常简单。您可能还想阅读TPL Dataflow,它旨在简化生产者/消费者场景。

于 2013-03-15T20:02:24.883 回答