0

瞧这里。

我正在尝试利用 tsvector 来计算术语的频率。我想我快到了,但我找不到从 tsvector 结构中获取术语的方法。

我所做的是,在创建 tsvector 列之后: select term_tsv, count(*) count from (select unnest(term_tsv) term_tsv from document_tsv) t group by term_tsv order by count desc; 结果是这样的: stem_tsv | count ------------------------+------- (3,{9},{D}) | 1 我因为不知道括号代表什么样的表达式而迷失了方向。谁能告诉我如何从外壳中提取术语?谢谢你。

4

1 回答 1

0

我发现像下面这样列出了前 10 个最常见的条目,这些条目是写在官方手册中的。 SELECT * FROM ts_stat('SELECT vector FROM apod') ORDER BY nentry DESC, ndoc DESC, word LIMIT 10; 只是为了记录。

于 2016-06-30T08:07:12.143 回答