有没有办法从 Postgres 中的 tsvector 列中获取出现统计信息?
例如,让我们采用以下三个 tsvector:
['sun', 'walk', 'public']
['sun', 'happy', 'warm', 'public']
['happy', 'sun']
我想找到每两个词位组合,包括它们的出现计数,它们至少一起出现两次,以便查询结果
('sun', 'public', 2)
('sun', 'happy', 2)
还有一种方法可以考虑词位之间的距离,以便 ('sun' 'happy') 组合得分更高?
感谢每一个帮助
安迪