我想使用 Spark History Server API ( http://127.0.0.1:18080/api/v1/applications/ ) 来识别 /tmp/spark-events/ 中某些作业写入的日志文件。我可以看到作业 ID 与日志文件名相同,所以我想如果我有一个唯一的作业名称,我可以查找它并获取关联的 ID。我的问题是我有一个 scala 应用程序,它在代码中设置应用程序名称:
val conf = new SparkConf()
.setAppName(s"TeraGen ($size)")
每次运行作业时,它都具有相同的名称。是否可以在命令行中覆盖应用程序名称?我尝试过,--name
但这不起作用。
如果做不到这一点,有没有更好的方法来做到这一点?