如何使 Apache Tika 索引 PDF 和文本文件(包括子目录)的目录并将其提交给 Apache Solr,以便我可以使用搜索引擎搜索该目录的内容?
任何建议,在 Windows 或 Linux 上都没关系。我无法让它工作,因为这两个项目的文档主要是为开发人员准备的,这很好,但是,我不能让他们这样做,因为文档含糊不清,对于非 java 来说不够清晰开发商。
非常简单:我如何使用 Apache Lucene 系列项目构建搜索引擎,这些项目可以索引并提供对 /home/material 或 c:/material 或 /cygdrive/c/material 的搜索
非常感谢提前