我正在尝试使用 SOLR 索引一组 HTML 文件。基本思想是为开发的网站实现网站搜索功能。我对 Lucene 和 SOLR 非常陌生,并且已经尝试了站点中可用的一些示例,并使用它索引了一些文档。但是我无法就什么是最好的做事方式得出结论。有些人建议使用 DataImportHandler,有些地方我看到使用 ExtractingRequestHandler。我这边的一个简单尝试是使用 ExtractingRequestHandler。另外我将不得不更新文件列表,例如,将来可能会删除一些 HTML,可能会添加一些 HTML 等等。请在选择方法时建议要考虑的因素
干杯!!