我有一个团队,其中许多成员有权通过命令行将 Spark 任务提交给 YARN(资源管理)。很难跟踪谁在使用多少内核,谁在使用多少内存……例如,现在我正在寻找可以帮助我监控每个成员使用的参数的软件、框架或其他东西。它将成为客户端和 YARN 之间的桥梁。然后我可以用它来过滤提交命令。
我确实看过mlflow,我真的很喜欢 MLFlow Tracking,但它是为 ML 训练过程而设计的。我想知道我的目的是否有替代方案?或者该问题有任何其他解决方案。
谢谢!
我有一个团队,其中许多成员有权通过命令行将 Spark 任务提交给 YARN(资源管理)。很难跟踪谁在使用多少内核,谁在使用多少内存……例如,现在我正在寻找可以帮助我监控每个成员使用的参数的软件、框架或其他东西。它将成为客户端和 YARN 之间的桥梁。然后我可以用它来过滤提交命令。
我确实看过mlflow,我真的很喜欢 MLFlow Tracking,但它是为 ML 训练过程而设计的。我想知道我的目的是否有替代方案?或者该问题有任何其他解决方案。
谢谢!