0

是否可以使用 SOLR 或 lucene 对驻留在 Hadoop 存储中的数据进行索引?数据可以包含任何内容,包括 pdf、doc、docx 等。如何实现?我很困惑。非常感谢任何指导帮助:)

4

1 回答 1

0

免责声明:我没有使用 Azure 上的 Hadoop 的经验。

基本上,您可以使用以下代码从 HDFS 检索每个文件。

之后,您可以使用此内容执行任何操作,例如在 Lucene 中进行索引。为此,请点击以下链接

于 2012-12-04T08:13:53.997 回答