2

如果我有如下设置,假设我将有 3 个节点加入集群,并且我使用循环池。

var worker = cluster.ActorOf(Props.Create<Worker>().WithRouter(
                 new ClusterRouterPool(
                     new RoundRobinPool(5),
                     new ClusterRouterPoolSettings(30, true, 1))), "worker");

“工人”只记得它已经处理了多少条消息,如下所示

public class Worker : TypedActor, IHandle<int> {
readonly List<int> processed;

public Worker()
{
    processed = new List<int>();
}

public void Handle(int message)
{
    System.Threading.Thread.Sleep(new Random().Next(1000, 2000));
    processed.Add(message);
    Console.WriteLine("WORKER ({0}) [{1}:{2}], processed: {3}", message, Context.Self.Path, Cluster.Get(Context.System).SelfUniqueAddress.Address.Port, processed.Count);
}

无论如何要在不同集群节点上的不同参与者之间同步“已处理列表”?这是 akka.net.cluster.sharding 最终会做的事情吗?还是我在做一些完全没有意义的事情?

4

1 回答 1

4

一般来说,您的问题似乎与 JVM akka eventuateddata插件提供的最接近。当您让参与者在同一条数据上工作时,每种情况下的一般副作用是最终一致性 - 由于您的状态在多台机器上工作的许多参与者之间“共享”,因此特定时间点的实际状态可能会变得模糊并且会根据您将采取哪个演员的观点而有所不同。

目前,我还没有听说过任何针对您的案例在 .NET 土地上已完成的生产就绪选项,但Akka.DistributedData - 目前正在开发中 - 将允许您完成任务。这是CRDTs的 Akka 实现。

CRDT 将为您提供的是对最终一致的数据类型的访问,这些数据类型可以在分布式集群中的不同节点上复制,直到整个应用程序中的总状态简洁。在这种情况下,您可以替换您的processed列表,GSet该列表允许您以分布式方式将元素附加到一个数据集。

如果您不想等待、冒险或自己构建 CRDT,您可以使用Riak等第三方解决方案

PS:Akka.Cluster.Sharding 有一个不同的目的,即自动将你的actor均匀分布在你的集群上——即使节点数量发生变化——这样特定actor的唯一一个实例将出现在当前集群范围内。

于 2015-11-09T07:56:35.017 回答