Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
是否可以使用 SOLR 或 lucene 对驻留在 Hadoop 存储中的数据进行索引?数据可以包含任何内容,包括 pdf、doc、docx 等。如何实现?我很困惑。非常感谢任何指导帮助:)
免责声明:我没有使用 Azure 上的 Hadoop 的经验。
基本上,您可以使用以下代码从 HDFS 检索每个文件。
之后,您可以使用此内容执行任何操作,例如在 Lucene 中进行索引。为此,请点击以下链接