0

我是 Hadoop 的新手,并试图在数据仓库和分析方面学习它。

有人可以建议我如何设置我的练习机,尤其是关于 1.开始学习所需的机器/节点数 2.是否建议在 Windows 上设置?3.需要安装什么软件 4.测试/样本数据的可用性

此外,我想获得有关使用 Hive 执行 BI 操作的最佳方式的建议。

谢谢你。

4

1 回答 1

0

如果您对 hadoop 机器更感兴趣,我建议您下载 cloudera VM。另一种立即开始的方法 - 使用亚马逊 EMR(弹性 mapreduce)。有一个选项可以在那里创建交互式 hive 集群并开始使用存储在 S3 中的数据集。
关于节点的数量 - 这取决于目标。如果您有兴趣“感受”一些 hadoop 性能 - 至少尝试 4-6 个节点。
如果您无权访问组织的内部 hadoop / hive 集群,上面列出的两种方式都很好。即使在这种情况下 - 我建议在使用共享环境之前尝试与他们一起动手操作。

于 2012-09-25T07:59:31.240 回答