4

我有一个客户在一个新的 Oracle UCM 站点上测试全文(下面的示例)搜索。他们选择测试的随机文本字符串是“仅测试”。哪个失败了;从我的测试来看,“only”似乎是一个保留字,因为它永远不会从全文搜索中返回(它是从元数据搜索中返回的)。

我花了一上午的时间搜索 oracle.com,发现这个看起来很全面,但没有“唯一”。

所以我的问题是,“只是”一个保留字。在哪里可以找到完整的 Oracle 全文搜索 (10g) 保留字列表?

全文搜索字符串示例;

(<ftx>test only</ftx>)


更新。 我做了更多的测试。似乎它忽略了指示地点或时间的词;只有,一些,直到,何时,同时,在哪里,那里,这里,附近,那个,谁,关于,这个,他们。

谁能证实这一点?我无法在任何地方的 Oracle 上找到它。


更新 2。发布答案 我应该一直在寻找不是“保留”的“停止”词。更新了问题标题和标签以反映。

4

3 回答 3

5

附加答案:

选择 *
来自 DR$STOPWORD
左连接 DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID

结果中,SPL_*字段来自DR$STOPLIST系统表,SPW_*字段来自DR$STOPWORD

  • 从用户模式,用户定义的停止列表和停止词可以通过检索
从 CTX_USER_STOPLISTS 中选择 *;
从 CTX_USER_STOPWORDS 中选择 *;
于 2011-04-18T13:34:12.033 回答
3

我敢打赌,系统正试图自动忽略频繁出现的单词。这可以解释为什么您无法找到“仅”但可以找到“仅”。你能搜索'a','an',...

您给出的不起作用的单词列表看起来像是一些非常常见的单词,这些单词通常不是句子中的主要单词。鉴于此,它们不太可能是您在全文搜索中搜索的词。

您正在寻找包含单词“that”并且包含该单词是您在文章中唯一的事实的文章的几率是多少?

我想我找到了你的名单......具有讽刺意味的是,来自我创办的最后一家公司的 wiki 页面......:http ://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29

2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
 • CTX_DDL.ADD_STOPWORD
 • CTX_DDL.REMOVE_STOPWORD
 • CTX_DDL.ADD_STOPTHEME
 • CTX_DDL.ADD_STOPCLASS
 When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.

默认停用词列表:

a he out up
be more their at
had one  will  from
it than and is
only when corp not
she also in  says
was by ms to
about her  over  
because  most  there  
has or  with  
its that are  
of which could  
some an inc  
we can mz  
after  his s  
been mr they  
have other  would  
last the as  
on who for  
such any into  
were co  no  
all if so  
but mrs this

更新 - Oracle 提供的一份不错的白皮书,其中包括全文搜索的工作原理,可从以下网址下载:http ://www.oracle.com/technology/products/text/pdf/text_techwp.pdf 。他们提到了停用词和有一个默认列表的事实,但没有提到这些词本身。

于 2010-06-08T06:15:57.887 回答
0

保留关键字: http ://www.toadworld.com/KNOWLEDGE/KnowledgeXpertforOracle/tabid/648/TopicID/SQL15/Default.aspx 点击左侧的“关键字保留字”。

“仅”在列表中。

我不确定您的情况发生了什么,但我无法想象 Oracle 不会仅在全文搜索中支持该词。在许多全文案例中,您必须搜索一个单词。这可能是您遇到的问题吗?

于 2010-06-08T02:44:52.477 回答