0

我需要在使用 Solr 数据导入处理程序的文件内容中进行搜索。响应应显示搜索词出现的内容行。因此,对于逐行处理,我使用的是 Line Entity Processor。我的数据配置文件是

<dataConfig>
<dataSource type="BinFileDataSource" name = "fds"/>
<document>
<entity name="filelist" processor="FileListEntityProcessor" fileName="sample.docx"
          rootEntity="false"   baseDir="C:\SampleDocuments" >
        <entity name="fileline" processor="LineEntityProcessor"
                url="${filelist.fileAbsolutePath}" format="text">                   
                <field column="linecontent" name="rawLine"/>
        </entity>
</entity>
</document>

schema.xml 有条目或 rawLine。

<field name="rawLine"  type="text" indexed="true" stored="true"/>

但是当我运行完全导入的命令时,它会抛出异常 DataImportHandlerException:java.lang.ClassCastException: java.io.FileInputStream cannot be cast to java.io.Reader

请帮助我,因为我在这个问题上花了几天时间。

4

1 回答 1

0

BinFileDataSource与 InputStream 一起使用FileDataSource
您可以尝试使用 FileDataSource 来检查 Casting 问题。

<dataSource type="FileDataSource" name = "fds"/>
于 2013-09-10T04:36:29.583 回答