大家好,
我想知道是否有人可以帮我解决这个问题。我是 solr 的新手,我正在尝试索引二进制文件,例如 .pdf、.docx ... 问题是我的 solr 配置索引文件但是当我运行查询时它不显示驻留在文件中的内容.
我使用的是默认的 schema.xml。
对于 data-config.xml 我使用这个配置:
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/db"
user="Iam" batchSize="-1"/>
<document>
<entity name="data" datasource="mysql" recursive="true"
query="select id, post, guid from posts'"
>
<field column="guid" name="content"/>
</entity>
</document>
</dataConfig>
在 solrconfig.xml 中:
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
<requestHandler name="/update/extract"
startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="lowernames">true</str>
<str name="uprefix">ignored_</str>
</lst>
</requestHandler>
我希望有人能给我一些建议。先谢谢了。