1

是否可以使用 Hive 查询分布在 Hadoop 上的 Lucene 索引???

4

4 回答 4

1

Hadapt是一家初创公司,其软件将 Hadoop 与 SQL 前端(如 Hive)和混合存储引擎连接起来。它们提供了可以满足您需求的档案文本搜索功能。

免责声明:我为 Hadapt 工作。

于 2011-11-09T00:36:45.700 回答
0

据我所知,您基本上可以在 Hive 中编写自定义“行提取”代码,所以我猜您可以。我从来没有使用过 Lucene,也几乎没有使用过 Hive,所以我不能确定。如果您对您的问题找到更确凿的答案,请发布!

于 2011-02-03T02:25:03.233 回答
0

我知道这是一个相当老的帖子,但我认为我可以提供更好的选择。

在您的情况下,与其麻烦地将 HDFS Lucene 索引映射到配置单元模式,不如将它们推送到 pig 中,因为 pig 可以读取平面文件。除非您想要一种存储数据的关系方式,否则您可以通过 Pig 处理它们并使用 Hbase 作为您的数据库。

于 2012-03-26T19:25:42.383 回答
0

您可以为 Hive 编写自定义输入格式以访问 Hadoop 中的 lucene 索引。

于 2012-07-10T18:16:53.077 回答