我对 有一些误解FTS
,如果有人能够帮助我,我将不胜感激。
目标:MATCH
使用函数进行全文搜索。
问题:无法通过扩展ASCII
字符进行搜索,例如:'#¿®£$
等。
详细信息:有三个预定义的分词器simple
:porter
和unicode61
。但是所有这些标记器都将特殊符号识别为分隔符,因为文档说:
术语是符合条件的字符的连续序列,其中符合条件的字符都是字母数字字符和 Unicode 代码点值大于或等于 128 的所有字符。
可能的解决方案(坏的):有一种方法可以指定额外的符号,这些符号应该用作标记的分隔符或作为标记的一部分。
CREATE VIRTUAL TABLE text USING FTS4(column, tokenize=unicode61 "tokenchars='$%")
之后,我可以找到诸如:that's
、、doll$r
等等之类60%40
的词,因为标记器不会按'$%
符号拆分标记。
但这不适合我,因为ASCII
表中有很多扩展符号,列出所有符号并不是一个好的解决方案。
主要问题:通过特殊符号进行搜索的最佳解决方案是什么。
非常感谢,如果需要,请随时询问更多详细信息。