我按照本教程从 .NET 控制台应用程序向 HDInsight 提交 mapreduce 作业。
它工作正常,但我想知道这一行:
var jobDefinition = new MapReduceJobCreateParameters()
{
JarFile = "wasb:///example/jars/hadoop-examples.jar",
ClassName = "wordcount"
};
“wasb:///example/jars/hadoop-examples.jar”指的是我的 Azure 存储帐户中的一个 jar,当我将帐户连接到新的 HDInsight 群集时,它会自动放在那里。
超越示例(我想使用 Mahout)......我可以引用我添加到集群节点的 jar 吗?我通过 RDP 将 mahout 安装到了 apps/dist 目录中。我可以从那里很好地运行 Mahout 作业,但我不能将这两个步骤放在一起。
感觉就像我不应该将 jar 文件添加到 blob 存储来使用它们。