0

我对Solr有点陌生,我正在尝试在 solr 中索引大约 100 万条推文,以便之后能够搜索它们

我在MYSQL数据库中有这些推文我知道如何在 Solr 中索引单独的文件,但实际上我不能将推文分成 1M 文件

所以我问是否有办法在solr中逐行索引sql表

我已经尝试过:

  • 在 Solr 中索引单独的 xml 文件
  • 我知道它可以从DataImportHandler处理,但对教程有点困惑
4

1 回答 1

0

您走在正确的轨道上,使用数据导入处理程序 (DIH) 是一个不错的起点。您是否在 DataImportHandler wiki 页面上看到了指向DIH 快速入门的链接。对于您给定的用例,这应该非常接近您的需要。

为了运行 /example/example-DIH 文件夹中 solr 附带的 DIH 示例,您需要使用 Readme.txt 文件摘录中列出的最后一个示例启动 Solr:

默认情况下,start.jar 使用默认的 solr 主目录“./solr/”在 Jetty 中启动 Solr -- 要运行其他示例配置,您可以在启动 jetty 时指定 solr.solr.home 系统属性...

java -Dsolr.solr.home=多核-jar start.jar

java -Dsolr.solr.home=example-DIH -jar start.jar

于 2012-11-08T12:43:21.123 回答