1

我正在搜索技术词“AN-XYZ99”。所以我用

SELECT *
FROM foo
WHERE CONTAINS(bar, 'AN{-}XYZ99') > 0

但我也得到像“FO-XYZ99”或“BAR-XYZ99”这样的结果。我能做些什么来确保预期的结果?

我用了

BEGIN
    CTX_DDL.CREATE_PREFERENCE('FOO','BASIC_LEXER');
    CTX_DDL.SET_ATTRIBUTE('FOO', 'ALTERNATE_SPELLING', 'GERMAN');
    CTX_DDL.SET_ATTRIBUTE('FOO', 'COMPOSITE', 'GERMAN');
    CTX_DDL.SET_ATTRIBUTE('FOO', 'MIXED_CASE', 'NO');
END;

来自“bar”列的示例数据 (VARCHAR2(4000)):

"unbekannt Stadt Text: AN-XYZ99 << foobar Straße 31.12.2017 Datum Host 20160101 foo"
"unbekannt Stadt Text: FO-XYZ99 << foobar Straße 31.12.2017 Datum Host 20160101 bar"
"unbekannt Stadt Text: BAR-XYZ99 << foobar Straße 31.12.2017 Datum Host 20160101 bla"

使用上面的语句,我希望第一行作为输出,但我也得到第二行和第三行。

Oracle Database 11g 企业版 11.2.0.3.0 - 64 位生产

4

1 回答 1

2

首先,您必须printjoin在词法分析器中将连字符定义为 a。

检查它

select IXV_ATTRIBUTE, IXV_VALUE from CTXSYS.CTX_INDEX_VALUES where IXV_CLASS =  'LEXER';

IXV_ATTRIBUTE                  IXV_VALUE     
-----------------------------------------
PRINTJOINS                     _$%&-         
NUMJOIN                        .              
NUMGROUP                       .              
WHITESPACE                     ,= 

然后您可以(在使用此词法分析器重新创建索引之后)验证标记是否符合预期:(您的表会根据索引名称而有所不同;检查所有表,如 'DR$%$I')

select TOKEN_TEXT from DR$TEXTIDX_IDX$I where TOKEN_TEXT like '%-XYZ99';
TOKEN_TEXT                                                     
----------------------------------------------------------------
AN-XYZ99                                                         
BAR-XYZ99                                                        
FO-XYZ99

现在您可以查询搜索字符串。

显然,您必须转义连字符,因为BAR-XYZ99会找到BAR 包含的行XYZ99; 虽然文档hyphen with no space有点不同。

SELECT SCORE(1),txt
FROM textidx
WHERE  CONTAINS(txt, 'BAR-XYZ99',1) > 0; 

  SCORE(1) TXT                                                                                
---------- ------------------------------------------------------------------------------------
         4 unbekannt Stadt Text: FO-XYZ99 << foobar Straße 31.12.2017 Datum Host 20160101 bar

由于某种原因(我在 11.2.0.2.0 上),用花括号转义不起作用(返回不匹配),但使用反斜杠很好。

SELECT SCORE(1),txt
FROM textidx
WHERE  CONTAINS(txt, 'BAR\-XYZ99',1) > 0;  

  SCORE(1) TXT                                                                                
---------- ------------------------------------------------------------------------------------
         4 unbekannt Stadt Text: BAR-XYZ99 << foobar Straße 31.12.2017 Datum Host 20160101 bla 
于 2018-01-02T15:58:21.870 回答