除了命令行之外,还有一种简单的方法来使用 Hadoop 吗?
您正在使用哪些工具,哪一个是最好的?
Hue 非常酷,新功能会定期推出,而且它是开源的。
来自其网站:Hue 具有适用于 HDFS 的文件浏览器、适用于 MapReduce 的作业设计器/浏览器、适用于 Hive、Pig、Cloudera Impala 和 Solr Search 的查询编辑器。它还附带一个用于创建工作流的 Oozie 应用程序、各种 Shell 和一组 Hadoop API。
虽然 Enrico 已经回答了这个问题,但我想补充几点。
Hue 是一个非常棒的工具,过去一年我们一直在 Goibibo.com 上使用它。我们已经向开发人员和业务人员公开了它,以运行他们的配置单元查询并获得结果。
此外,我们正在索引日志数据,因此 cloudera 搜索非常方便。使用新版本的 Hue (3.6),您还可以使用 HUE 本身对 RDBMS 数据运行查询。
我真的会推荐使用它,因为它使用起来非常简单,并且为大数据生态系统中的大部分内容提供了一个 GUI。
如果您使用的是 Windows,则可以使用名为HDFS Explorer的开源项目。
如果您使用的是 Mac 或 Linux,那么您可以使用 FUSE 直接挂载 Hadoop 文件系统,然后使用 Finder、或 Nautilus 或您通常用于文件系统导航的任何工具。查看 Hadoop wiki,了解如何设置挂载http://wiki.apache.org/hadoop/MountableHDFS
每个发行版都提供一个基于 Web 的 GUI,在某些情况下是 Hue,而在其他情况下是基于新的 Ambari 视图框架,它提供对文件功能的访问。
如果您使用的是 CDH,那么 Hue(hadoop 用户界面)会附带它。它是一个非常好的 hadoop 用户界面。您也可以单独使用安装。它支持hadoop的所有组件。
如果您只是在寻找从 cli 升级的东西以进行探索,我的安装有一个安装了 hadoop 的 Web 服务器,它可以在:50075 访问。该端口是可配置的,但请尝试一下。
您可以寻找一些数据集成工具,例如 Talend、CloverETL 或 Pentaho。他们为 Hadoop 提供了支持。Talend 提供了广泛的支持。没有太多关于 Hadoop 支持的其他工具的信息。
这是一个轻量级的 Hadoop 文件管理器HFX。你可以使用这个。它具有一些基本功能,如拖放、上传、剪切、复制和粘贴...