我正在尝试连接到仅通过 HDFS 无法访问的远程 hadoop 集群。现在它正在以这种方式使用:用户通过 SSH 连接到 Jump box(例如 ssh user@somejumboxhost.com),然后从 jump box 服务器我们也使用 ssh 连接到 hadoop(例如 ssh user@realhadoopcluster1.com)。我要做的是使用 HDFS 客户端从我的 Scala/Java 应用程序访问文件。现在我感觉就像在 Matrix 中一样——“我必须更深入”并且不知道如何访问服务器。
可能有人有类似的经历?现在我正在尝试从我的应用程序使用 SSH 客户端连接到第一台服务器,但是我不知道如何调用 HDFS 客户端。
任何想法将不胜感激,谢谢!