Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想在提交生产之前在开发工作站上运行 hadoop 作业进行测试。hadoop 中的哪种模式操作允许在使用单台机器时最接近地模拟生产集群。
Cloudera 的伪分布式模式下的 CDH4 在单台机器上运行。多个工人的模拟是通过命令行完成的,非常简单!并且文档(如果正确遵循)是您需要阅读以使集群运行的所有内容。
我没有进行任何性能测试来将其与 Chris Gerken 的建议进行比较:VMware 模拟,但看到它运行得更高效我不会感到惊讶。无论如何,我想你只是想在 Linux 机器上测试它,两者都可以。
我在我的 vmware 映像上使用伪分布式模式在部署之前进行测试。