1

我对 有一些误解FTS,如果有人能够帮助我,我将不胜感激。

目标:MATCH使用函数进行全文搜索。

问题:无法通过扩展ASCII字符进行搜索,例如:'#¿®£$等。

详细信息:有三个预定义的分词器simpleporterunicode61。但是所有这些标记器都将特殊符号识别为分隔符,因为文档说:

术语是符合条件的字符的连续序列,其中符合条件的字符都是字母数字字符和 Unicode 代码点值大于或等于 128 的所有字符。

可能的解决方案(坏的):有一种方法可以指定额外的符号,这些符号应该用作标记的分隔符或作为标记的一部分。

CREATE VIRTUAL TABLE text USING FTS4(column, tokenize=unicode61 "tokenchars='$%")

之后,我可以找到诸如:that's、、doll$r等等之类60%40的词,因为标记器不会按'$%符号拆分标记。

但这不适合我,因为ASCII表中有很多扩展符号,列出所有符号并不是一个好的解决方案。

主要问题:通过特殊符号进行搜索的最佳解决方案是什么。

非常感谢,如果需要,请随时询问更多详细信息。

4

0 回答 0