5

我正在寻找一个框架、框架组合、最佳实践或有关使用 Hadoop 可视化大型数据集的教程。

不是在寻找一个框架来可视化在 Hadoop 上运行 Hadoop 作业或管理磁盘空间的机制。我正在寻找一种方法或指南,以使用图形和图表等可视化 HDFS 中包含的数据。

例如,假设我有一组数据点存储在 HDFS 的多个文件中,我想显示数据的直方图。我唯一的选择是编写自定义映射/减少作业,该作业将尝试找出哪些点属于哪个存储桶,将总数写入文件,然后使用绘图库将其可视化?

我是否需要推出自定义解决方案,或者还有其他人在做这种事情吗?我正在尝试在网上查找,但我无法找到与此直接相关的内容。

谢谢您的帮助

4

1 回答 1

1

我们在Datameer做类似的事情。这些文件需要更多的处理步骤才能实现我们的可视化,但我们在 Hadoop 上本地运行,因此这些文件不会离我们很远。

于 2012-10-16T08:06:52.277 回答