我正在寻求一些帮助,我的任务是在工作中建立一个 Hadoop 集群。我已经在家里的笔记本电脑上使用开源堆栈完成了单节点的工作(我试图坚持使用开源的 Apache 堆栈以避免任何许可成本。现在我们对 Cloudera 或 HortonWorks 没有兴趣。)。
我遇到了 Apache BigTop 堆栈 (1.2.0) 并在那里闲逛。现在我仍在试图围绕它提供的内容(我还没有找到对 Hadoop/Spark 版本等的参考)。我可以在以下方面获得一些帮助:
1.2.0版本提供了哪些Hadoop/Spark/其他工具?
在 RHEL 7 下从头开始安装完整的 Hadoop/Spark 集群是否有很好的参考?我有 12 台服务器,我计划做 2 个名称节点和 10 个数据节点。BigTop 适合这个,还是我应该只安装每个包并手动配置?
我发现了以下内容:
这看起来很有希望,但它适用于 CentOS 7,我知道它是相似的,但并不完全相同。有人可以建议我如何修改它以在 RHEL 7 下工作吗?我找到了 repos,但没有找到 RHEL....
- Apache 官方页面上的文档似乎很薄,或者我只是没有找到正确的位置......是否有很好的链接可以指向完整的集群安装的参考资料?
感谢所有可以提供帮助的人,我真的很感激!