Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们需要精确搜索 CLOB 列中的任意字符序列。由于性能原因,搜索必须基于索引。
目前我们使用存储在单独表中的 n-gram。
通过 Oracle Text,我们了解到需要一个分词器。为了匹配我们的“精确和字符搜索”要求,这个分词器必须将我们的初始 CLOB 拆分为单个字符。任何字符都不能忽略。因为使用了倒排文本索引,我们怀疑这种解决方案是否合适。
另一种选择是将 Lucene 和 Java 与 Oracle 结合使用(假设 Lucene 支持精确的字符匹配)。
还有其他选择吗?