我对Solr有点陌生,我正在尝试在 solr 中索引大约 100 万条推文,以便之后能够搜索它们
我在MYSQL数据库中有这些推文我知道如何在 Solr 中索引单独的文件,但实际上我不能将推文分成 1M 文件
所以我问是否有办法在solr中逐行索引sql表
我已经尝试过:
- 在 Solr 中索引单独的 xml 文件
- 我知道它可以从DataImportHandler处理,但对教程有点困惑
我对Solr有点陌生,我正在尝试在 solr 中索引大约 100 万条推文,以便之后能够搜索它们
我在MYSQL数据库中有这些推文我知道如何在 Solr 中索引单独的文件,但实际上我不能将推文分成 1M 文件
所以我问是否有办法在solr中逐行索引sql表
我已经尝试过:
您走在正确的轨道上,使用数据导入处理程序 (DIH) 是一个不错的起点。您是否在 DataImportHandler wiki 页面上看到了指向DIH 快速入门的链接。对于您给定的用例,这应该非常接近您的需要。
为了运行 /example/example-DIH 文件夹中 solr 附带的 DIH 示例,您需要使用 Readme.txt 文件摘录中列出的最后一个示例启动 Solr:
默认情况下,start.jar 使用默认的 solr 主目录“./solr/”在 Jetty 中启动 Solr -- 要运行其他示例配置,您可以在启动 jetty 时指定 solr.solr.home 系统属性...
java -Dsolr.solr.home=多核-jar start.jar
java -Dsolr.solr.home=example-DIH -jar start.jar