0

我在 Windows 机器上使用 apache-solr-3.6.0。我想搜索包含标点符号的短语。例子:

"He said: Hi"

我试图逃避标点符号,\所以我的网址是:

http://localhost:8983/solr/select/?q="He%20said\:%20Hi"&version=2.2&start=0&rows=10&indent=on&debugQuery=true

但我发现 solr 修剪了解析查询中的标点符号,结果是:

<str name="rawquerystring">"He said\: Hi"</str>
<str name="querystring">"He said\: Hi"</str>
<str name="parsedquery">PhraseQuery(text:"he said hi")</str>
<str name="parsedquery_toString">text:"he said hi"</str>

那么如何在不修剪标点符号的情况下查询短语呢?

4

2 回答 2

0

您使用的是什么分析器/标记器?

检查 analysis.jsp 的行为并进行相应调整。

于 2012-09-18T19:23:47.127 回答
0

根据我的问题在这里

似乎问题出在字段类型中。因此,当我将架构修改为:

<field name="text" type="text_ws" indexed="true" stored="true" termVectors="true" multiValued="true"/>

有用。和text_ws分词器是WhitespaceTokenizerFactory

于 2012-09-19T19:28:43.620 回答