我正在尝试在 Amazon EC2 上永久设置 Hadoop。目前我正在做的是每天早上启动 EC2 实例并设置 Hadoop。有什么办法可以避免这个繁琐的步骤吗?我正在寻找可以加载到 EC2 上的 Hadoop 映像,让我的工作变得轻松。
我知道我可以将 EMR 用于 hadoop 服务。但是我不知道如何在不提交作业流的情况下启动 EMR (hadoop) 集群。我的意思是我需要一个没有任何作业在其中运行的 hadoop 集群。
最终我的目标是运行像Distmap和Seal这样的生物信息学应用程序。要运行这些应用程序,有许多依赖项。所以我需要一个免费的hadoop集群来设置环境,然后运行这些应用程序。我希望它清楚我想要做什么。
谢谢。