2

我正在开发一个以 Mircosoft Orleans 为基础的工作流引擎,因为它提供了许多有用的功能,例如自动分配工作和处理故障转移。

我有三种谷物:

  • 工作流 - 保存工作流中的信息以及应该以什么顺序执行工作块
  • 工作块 - 实际完成工作的部分
  • 执行 - 工作流的单次执行

我的问题是,当运行大量当前执行时,即> 1000,性能确实受到影响。我做了一些分析并将其缩小到谷物之间发生的通信。无论如何我可以再改进一下吗?

这是我的代码大纲以及颗粒如何相互作用

执行颗粒位于一个循环中,从工作流中获取下一个工作块,然后在工作块上调用执行。正是颗粒之间的这种不断调用导致我的一个测试工作流程的执行时间从运行单个执行时的 10 秒到运行超过 1000 时的大约 5 分钟。这可以改进还是我应该重新设计解决方案删除粮食通信?

[StorageProvider(ProviderName = "WorkflowStore")]
[Reentrant]
[StatelessWorker]
public class Workflow : Grain<WorkflowState>, IWorkflow
{
    public Task<BlockRef> GetNext(Guid currentBlockId, string connectionName)
    {
         //Lookup the next work block
    }
}

[Reentrant]
[StatelessWorker]
public class WorkBlock : Grain<WorkBlock State>, IWorkBlock 
{
    public Task<string> Execute(IExecution execution)
    {
         //Do some work
    }
}


[StorageProvider(ProviderName = "ExecutionStore")]
public class Execution : Grain<ExecutionState>, IExecution, IRemindable
{
    private async Task ExecuteNext(bool skipBreakpointCheck = false)
    {            
        if (State.NextBlock == null)
        {
            await FindAndSetNext(null, null);
        }

        ...

        var outputConnection = await workblock.Execute();

        if (!string.IsNullOrEmpty(outputConnection))
        {
            await FindAndSetNext(State.NextBlock.Id, outputConnection);
            ExecuteNext().Ignore();
        }
    }

    private async Task FindAndSetNext(Guid? currentId, string outputConnection)
    {
        var next = currentId.HasValue ? await _flow.GetNextBlock(currentId.Value, outputConnection) : await _flow.GetNextBlock();
        ...
    }
}
4

2 回答 2

5

这里有几个问题:

1)Workflow 是 StatelessWorker 并使用 StorageProvider 似乎不正确。StorageProvider 表示它有状态,它太关心持久化,StatelessWorker 表示它没有任何状态。而是使用常规的非 StatelessWorker 颗粒。

2)让我们从上往下看建模:Workflow 只是关于工作流的数据和要执行的代码,WorkBlock 是多块工作流的一个块(多步骤工作流的一个步骤),对吗?在这种情况下,它们都不应该是谷物。他们只是状态。执行是唯一需要粮食的。Execution 接收 Workflow,Workflow 在其数据中编码下一个块是什么,而 Execution 只执行该块。

3) 从可扩展性的角度来看,您只需要大量的执行粒度。如果工作流有一个 ID,那么您可以为每个工作流 ID 使用一个执行粒度。如果您想并行执行多次相同的工作流(具有相同的 id),现在就看情况了。如果它不是太多并行,也许一个 Execution grain 就足够了。如果没有,您可以使用一个 X 执行颗粒池(执行颗粒的 id 将是“WorkflowId-NumberBetween0AndX)。

于 2016-06-02T05:58:59.260 回答
1

在我看来,这些函数不应该是独立的grain,聚合它们将消除昂贵的grain间通信。

如果您将Work Block重命名为Activity并将Execution重命名为WorkflowInstance,您的概念将与 Microsoft 的 Workflow Foundation 非常相似。我在 GitHub ( Orleans.Activities ) 上启动了一个项目,以在 Orleans 上运行 WF4 工作流。虽然它还没有准备好生产,没有性能测试,但至少可以工作。也许你应该试一试。

于 2016-05-23T04:31:03.150 回答