0

我在 postgres 中有一个带有 ts_vector 列的搜索表。当我将 dstring 插入此列时,它看起来像是对其进行了矢量化处理,但它不会执行任何词干或删除停用词:

test=# create table sample_ts_vec ( id varchar(255), tsv tsvector);
CREATE TABLE
test=# insert into sample_ts_vec values ('t1234', 'this is a test');
INSERT 0 1
test=# select * from sample_ts_vec;
  id   |          tsv           
-------+------------------------
 t1234 | 'a' 'is' 'test' 'this'
(1 row)

test=# insert into sample_ts_vec values ('t1235', to_tsvector('this is a test'));
INSERT 0 1
test=# select * from sample_ts_vec;
  id   |          tsv           
-------+------------------------
 t1234 | 'a' 'is' 'test' 'this'
 t1235 | 'test':4
(2 rows)

您会注意到,在第二个插入中,删除了 3 个停用词,并且词干了(在这种情况下,不需要词干),而在第一个示例中,每个词都被添加。如何在插入之前将 to_tsvector 函数自动应用于字符串值?

4

2 回答 2

1

你可以创建一个假设TRIGGERON UPDATE OR INSERT 有一个列数据,你想在上面创建一个 tsv 索引,像这样

CREATE FUNCTION tsvfix() RETURNS TRIGGER LANGUAGE PLPGSQL AS $$
BEGIN
  NEW.tsv=to_tsvector(NEW.data);
  RETURN NEW;
END
$$;

CREATE TRIGER "tsvfix" ON UPDATE OR INSERT TO "sample_ts_vec" EXECUTE PROCEDURE tsvfix;
于 2015-01-05T04:11:33.160 回答
1

Jasen 的回答很接近,但有一些重要错误 - 这是更正后的版本:

CREATE FUNCTION tsvfix() RETURNS TRIGGER LANGUAGE PLPGSQL AS $$
BEGIN
  NEW.tsv=to_tsvector(NEW.tsv);
  RETURN NEW;
END
$$;

CREATE TRIGGER "tsvfix" BEFORE UPDATE OR INSERT ON "sample_ts_vec" FOR EACH ROW EXECUTE PROCEDURE tsvfix();

然而,即使这样也行不通。我收到一个错误ERROR: function to_tsvector(tsvector) does not exist

于 2015-01-09T20:35:55.747 回答