Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在寻找一个多服务器大数据示例应用程序,它可用于 (a) 尝试安装和配置大数据应用程序,以及 (b) 作为开发此类应用程序的示例起点 - 编辑代码,进行一些更改等... 在大多数技术(例如 Java EE)中,此类应用程序非常常见,并且作为起点非常有用。 如果它可以用于基准测试,那就更好了。
如果它使用 Hadoop、Cassandra、HBase、MongoDB、Hive、Redis 中的一个(或多个),那就太好了。
谢谢!
您可以使用 TeraSort,这是与 Hadoop 一起打包的基准测试。它对数 TB 的数据进行排序,并用于对新的 Hadoop 集群进行压力测试。hadoop-x.y.z-examples.jar它是 Hadoop 安装附带的文件的一部分。
hadoop-x.y.z-examples.jar
要使用它,请使用 Teragen 将数据生成到 HDFS,然后运行 Terasort。