我在 Amazon Web Services 上有一台机器,我正在尝试一些搜索功能。我已经在我的 AWS 机器上安装了 Nutch 和 Hbase。
我以爬取 wikipedia.org 为例,爬取的数据存储在云端的 Hbase 中。
我想安装 Solr 并对其进行搜索。我没有将我的系统安装为集群,因为我只是想进行一些研究,即如何使用它等。
我的问题是 Hadoop 在这个系统中的位置(我还没有安装 Hadoop)?在我的本地计算机上安装 Hadoop 和 Solr 是否合乎逻辑。此外,我的下一个挑战将是如何将我的本地计算机与 AWS 计算机通信。