我正在寻找一个框架、框架组合、最佳实践或有关使用 Hadoop 可视化大型数据集的教程。
我不是在寻找一个框架来可视化在 Hadoop 上运行 Hadoop 作业或管理磁盘空间的机制。我正在寻找一种方法或指南,以使用图形和图表等可视化 HDFS 中包含的数据。
例如,假设我有一组数据点存储在 HDFS 的多个文件中,我想显示数据的直方图。我唯一的选择是编写自定义映射/减少作业,该作业将尝试找出哪些点属于哪个存储桶,将总数写入文件,然后使用绘图库将其可视化?
我是否需要推出自定义解决方案,或者还有其他人在做这种事情吗?我正在尝试在网上查找,但我无法找到与此直接相关的内容。
谢谢您的帮助