1

我有一个包含推文的大阿拉伯文文本文件,每行包含一条推文,我想在 solr 中编制索引,以便该文档的每一行都应在单独的 solr 文档中编制索引

到目前为止我尝试了什么:

  • 我知道如何在 solr 中 SQL 数据库记录
  • 我知道如何更改 solr 架构以适应数据并使用数据导入处理程序
  • 我知道查询如何用于索引 solr 中的数据

我想要的是:

知道如何在 solr 中索引文本文件,以便将每一行视为 solr 文档

4

1 回答 1

1

我认为您应该查看 DataImportHandler 功能的 LineEntityProcessor。这在下面的链接中有详细解释。

LineEntityProcessor 此 EntityProcessor 逐行读取数据源中的所有内容,并为读取的每一行返回一个名为 rawLine 的字段。内容不以任何方式解析;但是,您可以添加转换器来操作 rawLine 字段中的数据,或创建其他附加字段。

http://lucidworks.lucidimagination.com/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

希望信息有所帮助。祝你好运!

于 2013-01-27T12:08:58.150 回答