我有一些包含序列的文档,例如radio/tested
我想在查询中返回命中,例如
select * from doc
where to_tsvector('english',body) @@ to_tsvector('english','radio')
不幸的是,默认解析器将radio/tested
其作为file
令牌(尽管在 Windows 环境中),因此它与上述查询不匹配。当我ts_debug
在它上面运行时,我看到它被识别为一个文件,并且词位最终是radio/tested
而不是两个词位radio
和test
.
有没有办法配置解析器不查找file
令牌?我试过了
ALTER TEXT SEARCH CONFIGURATION public.english
DROP MAPPING FOR file;
...但它并没有改变ts_debug
. 如果有某种禁用的方法file
,或者至少让它识别file
它认为构成目录名称的所有单词,或者如果有办法让它将斜杠视为连字符或空格(不会影响性能regexp_replace
ing 他们自己)这将非常有帮助。