0

我正在寻找一个多服务器大数据示例应用程序,它可用于 (a) 尝试安装和配置大数据应用程序,以及 (b) 作为开发此类应用程序的示例起点 - 编辑代码,进行一些更改等... 在大多数技术(例如 Java EE)中,此类应用程序非常常见,并且作为起点非常有用。
如果它可以用于基准测试,那就更好了。

如果它使用 Hadoop、Cassandra、HBase、MongoDB、Hive、Redis 中的一个(或多个),那就太好了。

谢谢!

4

1 回答 1

2

您可以使用 TeraSort,这是与 Hadoop 一起打包的基准测试。它对数 TB 的数据进行排序,并用于对新的 Hadoop 集群进行压力测试。hadoop-x.y.z-examples.jar它是 Hadoop 安装附带的文件的一部分。

要使用它,请使用 Teragen 将数据生成到 HDFS,然后运行 ​​Terasort。

于 2012-09-07T00:12:48.337 回答