有人可以告诉我如何解决下面提到的问题吗?
我有大量存储在 HDFS 中的文本文件。我的客户端应用程序需要查找特定搜索词的相关文件。我想知道 Apache Solr 是否可行。任何帮助是极大的赞赏。
谢谢,阿伦
我认为您需要考虑的第一个问题是搜索是实时的(索引会经常更新)还是会不那么频繁。如果是前者,那么我强烈建议您使用 Elastic Search。而且,不要仅仅依靠我的建议。这个问题对 Elastic Search vs Solr Debate 有一些很好的答案。
而且,关于您关于在 Apache Solr 中使用 hadoop 的问题,这里有一些我在互联网上找到的有用链接
http://www.likethecolor.com/2010/09/26/using-hadoop-to-create-solr-indexes
http://architects.dzone.com/articles/solr-hadoop-big-data-love