因为 sqlite fts 默认标记是“简单”,我可以将其更改为“搬运工”。但我必须支持非美国语言。像中文一样,它不能只按空格或点分隔。所以我想自定义分词器。有人可以给我一些建议吗?
如何在 Sqlite 中注册 Tokenizer。
SELECT fts3_tokenizer(<tokenizer-name>, <sqlite3_tokenizer_module ptr>);
因为 sqlite 是 Android 中的系统库,我不知道我是否可以注册。
- 是否有适用于所有语言的通用标记器?对于我的应用程序必须 i18n。只支持中文是没有用的。