瞧这里。
我正在尝试利用 tsvector 来计算术语的频率。我想我快到了,但我找不到从 tsvector 结构中获取术语的方法。
我所做的是,在创建 tsvector 列之后:
select term_tsv, count(*) count from (select unnest(term_tsv) term_tsv from document_tsv) t group by term_tsv order by count desc;
结果是这样的:
stem_tsv | count
------------------------+-------
(3,{9},{D}) | 1
我因为不知道括号代表什么样的表达式而迷失了方向。谁能告诉我如何从外壳中提取术语?谢谢你。