我是 HDInsight Spark 的新手,我正在尝试运行一个用例来了解 Azure Spark 群集中的工作原理。这是我到目前为止所做的。
能够创建天蓝色火花簇。
按照链接中所述的步骤创建 jar:创建独立的 scala 应用程序以在 HDInsight Spark 群集上运行。我使用了与链接中给出的相同的 scala 代码。
ssh 进入头节点
使用链接将 jar 上传到 blob 存储:使用 azure CLI 和 azure storage
将 zip 复制到机器 hadoop fs -copyToLocal
我已经检查了 jar 是否已上传到头节点(机器)。我想运行那个 jar 并获得上面第 2 点给出的链接中所述的结果。下一步会是什么?如何使用命令行界面提交 Spark 作业并获取结果?