1

我正在使用 SOLR 3.4 将富文本文档索引到 SOLR 3.4 中ExtractingRequestHandler,但我无法让它表现得像我想要的那样。

我想将创建日期存储为稍后用于分面搜索的字段,并在中定义了以下内容schema.xml

<field name="creation_date" type="date" indexed="true" stored="true"/>

我这样索引:

curl -s "http://localhost:8983/solr/update/extract?literal.id=myid&resource.name=myfile.xls&commit=true" -F myfile=@/path/to/myfile.xls

我得到了动态字段attr_creation_date(其他规则确保),但我没有得到creation_date. 我也没有成功地尝试过这样使用copyField

<copyField source="attr_creation_date" dest="creation_date"/>

另一个尝试是把它放进去solrconfig.xml,但没有运气:

<str name="fmap.Creation-Date">creation_date</str>

我很确定我在这里遗漏了一些基本的东西。非常感谢任何帮助!

ExtractingRequestHandlerin 的设置solrconfig.xml

<requestHandler name="/update/extract" startup="lazy" 
    class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">

        <str name="fmap.content">text</str>
        <str name="fmap.Last-Save-Date">last_save_date</str>
        <str name="fmap.Creation-Date">creation_date</str>
        <str name="fmap.Content-Type">content_type</str>
        <str name="lowernames">true</str>
        <str name="uprefix">attr_</str>

        <str name="captureAttr">true</str>
        <str name="fmap.a">links</str>
    </lst>
</requestHandler>

我的schema.xml文件(很多默认的东西):https ://gist.github.com/1358002

4

0 回答 0