postgresql - Postgres：基于词位推导本体

翻译自：https://stackoverflow.com/questions/38785310 2016-08-05T09:01:34.517

96 次

有没有办法从 Postgres 中的 tsvector 列中获取出现统计信息？

例如，让我们采用以下三个 tsvector：

['sun', 'walk', 'public']
['sun', 'happy', 'warm', 'public']
['happy', 'sun']

我想找到每两个词位组合，包括它们的出现计数，它们至少一起出现两次，以便查询结果

('sun', 'public', 2)
('sun', 'happy', 2)

还有一种方法可以考虑词位之间的距离，以便 ('sun' 'happy') 组合得分更高？

感谢每一个帮助

安迪

0 回答 0