我需要在使用 Solr 数据导入处理程序的文件内容中进行搜索。响应应显示搜索词出现的内容行。因此,对于逐行处理,我使用的是 Line Entity Processor。我的数据配置文件是
<dataConfig>
<dataSource type="BinFileDataSource" name = "fds"/>
<document>
<entity name="filelist" processor="FileListEntityProcessor" fileName="sample.docx"
rootEntity="false" baseDir="C:\SampleDocuments" >
<entity name="fileline" processor="LineEntityProcessor"
url="${filelist.fileAbsolutePath}" format="text">
<field column="linecontent" name="rawLine"/>
</entity>
</entity>
</document>
schema.xml 有条目或 rawLine。
<field name="rawLine" type="text" indexed="true" stored="true"/>
但是当我运行完全导入的命令时,它会抛出异常 DataImportHandlerException:java.lang.ClassCastException: java.io.FileInputStream cannot be cast to java.io.Reader
请帮助我,因为我在这个问题上花了几天时间。