问题标签 [webhdfs]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

250 问题

0 投票

1 回答

988 浏览

hadoop - WebHdfsFileSystem 本地 ip 与网络 ip hadoop

需要从 hdfs 集群外部读取 HDFS。我偶然发现了 WebHdfsFileSystem，即使我明白了这个想法，但我无法让它与网络地址一起工作。例如，只要我使用 127.0.0.1 或 localhost，下面的代码就可以正常工作。但是此刻我使用的网络ip地址是192.168。. ，我收到“重试连接到服务器”消息，然后是 ConnectException。

我不确定我在这里错过了什么。

hadoop webhdfs

2013-10-18T00:02:39.703

0 投票

1 回答

1286 浏览

hadoop - Webhdfs 返回错误的数据节点地址

这里它为datanode返回sslave0，对我来说似乎是一个内部地址

2013-11-12T17:49:23.403

0 投票

1 回答

406 浏览

hadoop - Distcp 到 webHDFS 降低了作业跟踪器

在尝试使用 distcp 将大量数据泵送到另一个集群时，我们遇到了一个奇怪的问题。

给出一些数字，

数据大小 = 320GB 映射器数量 = ~70 我们集群中的节点总数 82 src 集群：hadoop 0.20 目标集群：hadoop 2.0.2

当我们开始这项工作时，所有映射器都成功完成，但最后一个需要太长时间，当它完成/失败时，它基本上会冻结作业跟踪器近 15 分钟，之后所有任务跟踪器都会重新启动，从而重新启动所有作业当时正在集群中运行。

我们有多个 distcp 作业将数据传输到 S3 以及具有相同 hadoop 设置的其他集群，并且没有遇到这个问题。这个过程和其他的唯一区别就是这里我们使用的是webhdfs，webhdfs是瓶颈吗？

我们还尝试减小文件大小，检查网络带宽是否饱和，机器负载，但仍然无法解决这个问题。

另外，当两个hadoop版本不同时，是否有其他方式进行数据传输而不是使用webhdfs

谢谢

hadoop mapreduce hdfs cloudera webhdfs

2013-11-14T22:28:33.070

0 投票

1 回答

1484 浏览

java - 可能通过 HTTPS 与 WebHDFS 进行加密安全通信？

我正在使用 Cloudera Hadoop 环境。

在过去的几天里，我已经熟悉了 WebHDFS。我正在使用它通过 REST API 执行各种 HDFS 操作。

但是，现在我需要保护与 WebHDFS 的通信，即使用 SSL/HTTPS。

这可能吗？如果是，是否有任何明确的步骤来实现这一目标？

PS：目前，我不想使用 Kerberos。

java hadoop https hdfs webhdfs

2013-12-04T11:01:40.857

0 投票

1 回答

205 浏览

hadoop - 以编程方式检索特定作业的 tasktracker 日志

您好正在使用 OozieClient API。我需要使用 OozieClient API 检索特定工作流作业的任务跟踪器日志。如果不使用 OozieClient API，任何其他使用程序的方式也可以。到目前为止，使用 OozieClient 我可以使用 client.getJobLog() 获取作业日志，但我需要任务跟踪器日志而不是作业日志。请帮忙。

hadoop hdfs bigdata oozie webhdfs

2013-12-07T06:15:46.890

0 投票

2 回答

6590 浏览

node.js - 我应该使用哪个 nodejs 库来写入 HDFS？

我有一个 nodejs 应用程序，我想将数据写入 hadoop HDFS 文件系统。我见过两个主要的 nodejs 库可以做到这一点：node-hdfs 和 node-webhdfs。有人试过吗？有什么提示吗？我应该在生产中使用哪一个？

我倾向于使用 node-webhdfs，因为它使用 WebHDFS REST API。node-hdfs 似乎是一个 c++ 绑定。

任何帮助将不胜感激。

node.js hadoop hdfs webhdfs

2014-01-05T01:34:58.917

0 投票

1 回答

1296 浏览

java - 方案没有文件系统：webhdfs

我正在构建一个将一些数据推送到我的 HDFS 的客户端。因为 HDFS 在防火墙后面的集群内，所以我使用 HttpFS 作为代理来访问它。IOException当我尝试读取/写入 HDFS 时，客户端退出。消息是No FileSystem for scheme: webhdfs。代码很简单

它在最后一行崩溃。我正在使用 Maven 3.0.4 构建并将 Hadoop-Client 依赖项 2.2.0 添加到我的项目中。通过curl命令行访问可以正常工作。

任何想法为什么这可能会失败？

java hadoop hdfs webhdfs

2014-02-06T08:17:29.713

0 投票

1 回答

716 浏览

hadoop - Hadoop 文件复制本机 Java API 与 WebHDFS

我需要将文件从 HDFS 复制到本地。现在，我有 2 个选项。1) 使用 Hadoop Native Java API (FileSystem) 或 2) 使用 WebHDFS [我没有；在我的集群中启用它没有任何问题]

有人可以让我知道什么是首选选项，为什么？

hadoop webhdfs

2014-02-09T03:17:57.190

0 投票

1 回答

487 浏览

hadoop - WebHDFS 和 SequenceFiles

是真的 WebHDFS 不支持SequenceFiles吗？

我找不到任何说它确实的东西。我有通常的小文件问题，相信SequenceFiles会很好用，但我需要使用 WebHDFS。SequenceFile我需要通过 WebHDFS创建然后附加到一个。

hadoop webhdfs

2014-02-24T22:11:08.920

0 投票

3 回答

496 浏览

hadoop - 识别远程 Hadoop 集群的版本

如何通过api/web-services识别远程Hadoop集群的版本？即集群是1.x类型还是2.x类型？是否有任何可用的 API/Web 服务？

我研究过webhdfs？hadoop 文件系统但无法识别的方式来做到这一点？

hadoop webhdfs

2014-04-17T08:54:07.350

1 2 3 4 5 6 7 8 9 10

问题标签 [webhdfs]

Reference