erlang - Erlang supervisor动态改变重启强度

Question

我的问题是，除了发布升级场景之外，是否可以修改已经运行的主管的重启强度阈值，如果可以，如何修改？

它以前从未出现过，但是运行一个最初没有孩子的主管，以便另一个进程通过主管启动孩子：start_child/2，所以我的 sup init/1 是这样的：

init([]) ->
    RestartSt = {simple_one_for_one, 10, 10},
    ChSpec = [foo, {foo,start_link,[]}, transient, 1000, worker, [foo]}],
    {ok, {RestartSt, ChSpec}}.

在主管开始时，可能的孩子数量是未知的；当然，它可能会从 10 到 10,000 甚至更多。

说 20 的重新启动强度对于 10 个孩子来说已经足够了，但是对于 10,000 个孩子，我希望能够增加它......并随着孩子数量由于正常终止而减少而减少它。

score 9 · Accepted Answer

没有用于执行此操作的 API，因此我相信您会坚持使用升级方法，除非您想通过提交包含代码更改、新测试和文档的完整补丁的拉取请求向 OTP 团队提出新的 API变化。

还有一种非常肮脏的 hack 方法，它涉及操纵内部主管状态，因此我绝对不建议将其用于生产系统，但我认为它仍然很有趣。Asupervisor将重启强度存储在其内部循环状态中。您可以通过调用sys:get_state/1,2主管进程来查看此状态。例如，这是Yaws Web 服务器中主管的状态：

1> rr(supervisor).
[child,state]
2> sys:get_state(yaws_sup).
#state{name = {local,yaws_sup},
       strategy = one_for_all,
       children = [#child{pid = <0.67.0>,name = yaws_sup_restarts,
                          mfargs = {yaws_sup_restarts,start_link,[]},
                          restart_type = transient,shutdown = infinity,
                          child_type = supervisor,
                          modules = [yaws_sup_restarts]},
                   #child{pid = <0.42.0>,name = yaws_server,
                          mfargs = {yaws_server,start_link,
                                                [{env,true,false,false,false,false,false,"default"}]},
                          restart_type = permanent,shutdown = 120000,
                          child_type = worker,
                          modules = [yaws_server]},
                   #child{pid = <0.39.0>,name = yaws_trace,
                          mfargs = {yaws_trace,start_link,[]},
                          restart_type = permanent,shutdown = 5000,
                          child_type = worker,
                          modules = [yaws_trace]},
                   #child{pid = <0.36.0>,name = yaws_log,
                          mfargs = {yaws_log,start_link,[]},
                          restart_type = permanent,shutdown = 5000,
                          child_type = worker,
                          modules = [yaws_log]}],
       dynamics = undefined,intensity = 0,period = 1,restarts = [],
       module = yaws_sup,args = []}

初始rr命令从中检索记录定义，supervisor因此当我们从中获取状态时我们可以看到字段名称yaws_sup，否则我们只会得到一个充满匿名值的元组。

在这种情况下，检索到的状态显示强度为 0。我们可以使用以下方法更改它sys:replace_state/2,3：

3> sys:replace_state(yaws_sup, fun(S) -> S#state{intensity=2} end).
#state{name = {local,yaws_sup},
       strategy = one_for_all,
       children = [#child{pid = <0.67.0>,name = yaws_sup_restarts,
                          mfargs = {yaws_sup_restarts,start_link,[]},
                          restart_type = transient,shutdown = infinity,
                          child_type = supervisor,
                          modules = [yaws_sup_restarts]},
                   #child{pid = <0.42.0>,name = yaws_server,
                          mfargs = {yaws_server,start_link,
                                                [{env,true,false,false,false,false,false,"default"}]},
                          restart_type = permanent,shutdown = 120000,
                          child_type = worker,
                          modules = [yaws_server]},
                   #child{pid = <0.39.0>,name = yaws_trace,
                          mfargs = {yaws_trace,start_link,[]},
                          restart_type = permanent,shutdown = 5000,
                          child_type = worker,
                          modules = [yaws_trace]},
                   #child{pid = <0.36.0>,name = yaws_log,
                          mfargs = {yaws_log,start_link,[]},
                          restart_type = permanent,shutdown = 5000,
                          child_type = worker,
                          modules = [yaws_log]}],
       dynamics = undefined,intensity = 2,period = 1,restarts = [],
       module = yaws_sup,args = []}

我们的第二个参数sys:replace_state/2将状态记录作为参数并将其intensity字段更改为 2。sys:replace_state/2,3函数返回新状态，正如您在此处结果的末尾附近看到的那样，intensity现在是 2 而不是 0。

正如sys:replace_state/2,3文档所解释的，这些函数仅用于调试目的，因此我绝对不推荐在生产系统中使用它们来执行此操作。这里的第二个参数replace_state表明，这种方法需要了解的内部状态记录的详细信息supervisor，我们在此处通过rrshell 命令获得了这些信息，因此如果该记录发生更改，此代码可能会停止工作。更脆弱的是将supervisor状态记录视为一个元组并指望intensity字段位于特定的元组位置，以便您可以更改其值。因此，如果您真的想要更改主管重新启动强度的功能，从长远来看，您最好向 OTP 团队建议添加它；如果你打算走那条路，我建议首先在erlang-questions 邮件列表中提出这个想法以衡量兴趣。

score 1 · Accepted Answer

一种解决方案是嵌套您的主管。但主要问题是你想通过这种重启强度来实现什么。当你想杀死主管时的强度需要表明一些非常错误的事情，例如所需的资源意外地不可用。

erlang - Erlang supervisor动态改变重启强度

2 回答 2

Related

Reference