我正在使用 SOLR 3.4 将富文本文档索引到 SOLR 3.4 中ExtractingRequestHandler
,但我无法让它表现得像我想要的那样。
我想将创建日期存储为稍后用于分面搜索的字段,并在中定义了以下内容schema.xml
:
<field name="creation_date" type="date" indexed="true" stored="true"/>
我这样索引:
curl -s "http://localhost:8983/solr/update/extract?literal.id=myid&resource.name=myfile.xls&commit=true" -F myfile=@/path/to/myfile.xls
我得到了动态字段attr_creation_date
(其他规则确保),但我没有得到creation_date
. 我也没有成功地尝试过这样使用copyField
:
<copyField source="attr_creation_date" dest="creation_date"/>
另一个尝试是把它放进去solrconfig.xml
,但没有运气:
<str name="fmap.Creation-Date">creation_date</str>
我很确定我在这里遗漏了一些基本的东西。非常感谢任何帮助!
ExtractingRequestHandler
in 的设置solrconfig.xml
:
<requestHandler name="/update/extract" startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="fmap.content">text</str>
<str name="fmap.Last-Save-Date">last_save_date</str>
<str name="fmap.Creation-Date">creation_date</str>
<str name="fmap.Content-Type">content_type</str>
<str name="lowernames">true</str>
<str name="uprefix">attr_</str>
<str name="captureAttr">true</str>
<str name="fmap.a">links</str>
</lst>
</requestHandler>
我的schema.xml
文件(很多默认的东西):https ://gist.github.com/1358002