我们正在评估部署 Storm,但我有点担心。我们目前运行 Hadoop MapReduce,并且希望将我们的一些处理从 MapReduce 转换到 Storm 进程。请注意,这是一些,但不是全部。我们仍然会有一些 MapReduce 功能。
我找到了 Mesos,它可以(可能)允许我们在同一硬件上维护 Storm 和 Hadoop 部署,但还有一些其他问题:
我设想理想的情况是能够在 Storm 和 Hadoop 之间任意“借用”插槽。前任。两者都将根据需要使用相同的资源。不幸的是,这是一个固定部署,而不是像 EC2 之类的“基于云”。
我想避免 Storm 环境中的瓶颈。一个理想的情况是根据需要“旋转”(或相反)更多 Bolts 实例。这可能/现实吗?
“重新启动”拓扑似乎是一项相当昂贵的操作,我不确定这是否真的是一种选择。理想情况下,我希望它尽可能无缝。
我们是否正确地处理了这个问题?本质上,Storm 拓扑会“提供”一个 MapReduce 批处理作业。我们的一些处理可以流式处理,作为 Storm 拓扑会更好,而其中一些需要批处理。
欢迎任何一般性反馈,即使它没有解决我的具体问题。在这一点上,这更像是一个探索阶段,我可能完全走错了路。