我有一个 Apache Spark MLlib Java 应用程序,它应该在具有不同输入值的集群上运行很多次。是否可以将应用程序jar缓存在集群上并重复使用以减少启动时间、网络负载和组件耦合?
使用的集群管理器有什么不同吗?
如果应用程序 jar 被缓存,是否可以在我的应用程序的不同实例中使用相同的 RDD 缓存?
我有一个 Apache Spark MLlib Java 应用程序,它应该在具有不同输入值的集群上运行很多次。是否可以将应用程序jar缓存在集群上并重复使用以减少启动时间、网络负载和组件耦合?
使用的集群管理器有什么不同吗?
如果应用程序 jar 被缓存,是否可以在我的应用程序的不同实例中使用相同的 RDD 缓存?