我有一个(理论上的)数据库,我正在存储某些单词的三元组:
例子:
[Javascript] = [jav, ava, vas, asc, scr, cri, rip, ipt]
等等...以及文本字段中的许多其他单词...
如果我想搜索script,我会搜索 ALL:
[scr, cri, rip, ipt]
但是,如果我想要“*script”或“script*” (在script之前或之后的任何内容) ,我会搜索什么?
示例:“ *脚本”
我应该得到这些词:[postscript, javascript, vscript, pscript]...等
或“脚本 *”
我应该得到这些词:[scriptor, scripting, scriptly]...等
这不是任何特定的数据库、SQL 或其他;我只是想了解使用 Trigrams 背后的理论,以及可以用它们做什么。