1

我们需要精确搜索 CLOB 列中的任意字符序列。由于性能原因,搜索必须基于索引。

目前我们使用存储在单独表中的 n-gram。

通过 Oracle Text,我们了解到需要一个分词器。为了匹配我们的“精确和字符搜索”要求,这个分词器必须将我们的初始 CLOB 拆分为单个字符。任何字符都不能忽略。因为使用了倒排文本索引,我们怀疑这种解决方案是否合适。

另一种选择是将 Lucene 和 Java 与 Oracle 结合使用(假设 Lucene 支持精确的字符匹配)。

还有其他选择吗?

4

0 回答 0