0

我想学习 Apache Nutch,我在 Amazon Web Services (AWS) 有一个帐户。我在 AWS 有三台机器,其中一台是微型的,另一台是小型的,另一台是中型的。我想从小型开始,我会在上面安装 Nutch、Hadoop 和 Hbase。我的机器上有 Centos 6。

这里有一个问题,但我没有问:Nutch 2.1 (HBase, SOLR) with Amazon Web Services

我想知道哪种方法更好。我想将它们安装在小型机器上。之后我想添加微型。另一方面,我对 Nutch 没有任何经验,也许我应该在本地工作,或者是否有可能同时使用我的机器和 AWS(是否收费更高,即从 AWS 复制数据可能会收费。)

当我想在我的 Nutch 中实现一个包装器时,我应该将它安装在我的本地(以获得源代码)并在 AWS 上运行它。

有任何想法吗?

4

1 回答 1

1

听起来你面临着一条陡峭的学习曲线。

一方面,你承认你只是在学习 Nutch,所以我建议你将 CentOS 安装在家里的物理机器上并在那里玩。

另一方面,您正在考虑使用微型 AWS 实例,这对于运行像 Nutch 这样的 CPU/内存密集型应用程序没有用处。在此处阅读有关AWS 微实例的信息

我的建议是在家中坚持使用单个物理盒解决方案,并在继续使用 AWS 实例之前编写解决方案的脚本。

于 2013-03-09T07:47:05.290 回答