我想学习 Apache Nutch,我在 Amazon Web Services (AWS) 有一个帐户。我在 AWS 有三台机器,其中一台是微型的,另一台是小型的,另一台是中型的。我想从小型开始,我会在上面安装 Nutch、Hadoop 和 Hbase。我的机器上有 Centos 6。
这里有一个问题,但我没有问:Nutch 2.1 (HBase, SOLR) with Amazon Web Services
我想知道哪种方法更好。我想将它们安装在小型机器上。之后我想添加微型。另一方面,我对 Nutch 没有任何经验,也许我应该在本地工作,或者是否有可能同时使用我的机器和 AWS(是否收费更高,即从 AWS 复制数据可能会收费。)
当我想在我的 Nutch 中实现一个包装器时,我应该将它安装在我的本地(以获得源代码)并在 AWS 上运行它。
有任何想法吗?