我正在尝试使用现有(独立)火花集群(在 Ubuntu Linux 上)尝试 C# 驱动程序,我通过 python 或 scala 愉快地与之交互。
我不清楚如何运行一个简单的 c# 示例,已将最新的 Mobius 版本下载到 linux 机器上。我不清楚的是 clr spark 提交所需的这两个额外参数(超出通常需要的参数)。当我尝试按照记录的提交参数进行操作时遇到各种错误(或者我误解了说明)
首先,对于--exe,是直接指向.exe文件还是需要通过;--exe [mono] [my_app.exe] [params] 其次,remote-spark-clr 似乎坚持使用 HDFS 路径,但我在没有 HDFS 的情况下运行 spark。HDFS真的有必要吗?第三,与问题(二)相关,如果为工人分发 exe/包,这些是否也必须在 hdfs 路径中,或者我可以将它们放在“常规”文件系统上的某个合理位置。
简而言之,我正在寻找不需要 HDFS 的确认以及可以在某个位置运行 exe 的简单单行提交示例。可悲的是,我尝试过的组合对我不起作用。