“spark-ui”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

231 浏览

apache-spark - 通过 conda 安装 pyspark 时没有 start-history-server.sh

我已经在 Ubuntu 的 miniconda 环境中通过conda install pyspark. 到目前为止一切正常：我可以运行作业，spark-submit并且可以检查正在运行的作业localhost:4040。但我找不到start-history-server.sh，我需要查看已完成的工作。

应该是在， spark的安装目录在{spark}/sbin哪里。{spark}我不确定通过 conda 安装 spark 时应该在哪里，但我已经搜索了整个 miniconda 目录，但似乎无法找到start-history-server.sh. 对于它的价值，这适用于 python 3.7 和 2.7 环境。

我的问题是：是否start-history-server.sh包含在 pyspark 的 conda 安装中？如果是，在哪里？如果不是，那么在事后评估火花工作的推荐替代方法是什么？

2019-01-29T10:36:20.270

0 投票

0 回答

379 浏览

apache-spark - 从 Spark UI SQL 选项卡获取查询 DAG 数据的任何 API

spark UI 有一个 SQL 选项卡。它可以将查询详细信息显示为 DAG

应用程序完成后，DAG 还会使用统计信息注释其节点。例如，

Spark 有任何 API 来获取指标吗？Spark 具有可通过 RESTful API 访问的https://spark.apache.org/docs/latest/monitoring.html#executor-task-metrics 。Spark UI 上的 stage 选项卡还显示了每个任务的“Summary Metrics”。然而

1) 我不确定如何将任务 ID 与查询 DAG 上的 RDD 或节点相关联

2) Peak Execution Memory 指标始终为 0，而我们可以看到 SQL 选项卡可以显示

另一个问题是如何读取 DAG 节点上的指标。例如，

节点的最小值、中值、最大值是多少？它的值远小于总的24.1G...

apache-spark apache-spark-sql pyspark-sql spark-ui

2019-03-05T06:04:13.423

0 投票

0 回答

124 浏览

apache-spark - 如何知道每个 Spark 任务/执行器运行什么样的工作

当我的应用程序在 Spark 集群上运行时，我知道以下内容

1) 执行计划

2）以节点为RDD或操作的DAG

3）所有作业/阶段/执行者/任务

但是，我不知道如何知道给定任务 ID 任务的工作类型（RDD 或操作）。

从一个任务中，我可以知道它的执行者 ID 和它运行的机器。在机器上，如果我们 grep Java 和 ID，我们可以得到

但它并没有告诉我它做了什么...... Spark 会公开信息吗？

apache-spark pyspark spark-ui

2019-03-08T21:56:29.563

0 投票

0 回答

249 浏览

apache-spark - Spark UI SQL 视图几乎不显示任何内容

我正在尝试使用 Spark SQL 优化一个程序，该程序基本上是一个巨大的 SQL 查询（连接像 10 个表，有很多案例等）。我更习惯于更多面向 DF-API 的程序，并且这些程序确实更好地显示了不同的阶段。

它的结构很好，我或多或少地理解它。但是我有一个问题，我总是使用 Spark UI SQL 视图来获得有关优化重点的提示。

但是在这种程序中，Spark UI SQL 什么也没显示，这是有原因的吗？（或一种强制它显示的方法）。

我希望看到每个连接/扫描后的输出行数等等......但我只看到一个完整的“WholeStageCodeGen”，用于“解析的逻辑计划”，就像 800 行

我无法显示代码，它有以下“点”：

有没有办法改善那里的追踪？（也许禁用 WholeStageCodegen？，但这可能会损害性能......）

谢谢！

apache-spark apache-spark-sql spark-ui

2019-03-15T18:30:37.040

0 投票

1 回答

547 浏览

java - 如何修复 SparkUI 执行器，java.io.FileNotFoundException

我已经使用 Apache Spark 部署了 Spring Boot 服务器，并且一切运行稳定。但是http://XXXX:4040/executors/ SparkUI executors端点抛出java.io.FileNotFoundException并且找不到/opt/x/x!/BOOT-INF/lib/spark-core_2.11-2.2.0.jar. 我检查了内罐。这个问题只发生在 Linux 上，在 Windows 上它可以正常工作。

java spring-boot apache-spark java-8 spark-ui

2019-04-23T07:45:53.180

0 投票

2 回答

1594 浏览