2

我很难理解这种情况。这是我第一次使用一些内置函数对此进行处理:

到目前为止我尝试过的

SELECT json_build_object('id', MD5(c.id), 'firstName', 
c.first_name, 'lastName', c.last_name, 'location', 
json_build_object('city', cl.city, 'state', cl.state))
FROM person p 
LEFT JOIN (SELECT id, city, state FROM 
person_location) pl ON pl.id = p.id
LIMIT 10

对于这个小例子来说效果很好,并且还返回 10 行。如果我取消限制,我将获得所有行。完美的; 但是,这意味着为将数据直接馈送到 Logstash 的视图提供支持,因此有一些自定义业务逻辑可以清理字段并执行其他一些轻量级任务。为了解决这个问题,尝试 plv8 是有意义的

plv8方法:

CREATE OR REPLACE FUNCTION generate_search_documents()   
RETURNS SETOF person_test AS
$$

const _ = require('lodash'),
    candidates = plv8.execute('select * FROM candidate LIMIT 10');

plv8.return_next(people);

$$
  LANGUAGE plv8;

我已经立即迷路了。我想要做的是选择我需要的具有正确连接的表,清理数据,构建我的 JSON 对象并每行返回一个。在第一种方法中,很明显在查询中我是在一个人的上下文中工作的。在下面的方法中,我似乎正在执行一个查询,该查询选择了我们表中的所有 80M 人。这并不容易。

知道如何使用这种方法来复制我在第一个示例中尝试做的事情吗?

4

1 回答 1

4

示例表:

create table person(id int primary key, first_name text, last_name text);
insert into person values
(1, 'John', 'Smith'),
(2, 'Phil', 'Jones');

select 
    json_build_object(
        'id', id, 
        'firstname', first_name, 
        'lastname', last_name)
from person;

                   json_build_object                    
--------------------------------------------------------
 {"id" : 1, "firstname" : "John", "lastname" : "Smith"}
 {"id" : 2, "firstname" : "Phil", "lastname" : "Jones"}
(2 rows)

如何修改函数中的行并将连续行作为json返回?

您应该将setof jsonb(or setof json) 声明为函数的返回类型。更新值并plv8.return_next()循环使​​用,例如:

create or replace function person_as_jsonb()
returns setof jsonb language plv8 as $$
    var persons = plv8.execute('select * from person');
    var len = persons.length;   
    for (var i = 0; i < len; i++) {
        persons[i].first_name = persons[i].first_name + '?';
        persons[i].last_name = persons[i].last_name + '!';
        plv8.return_next(persons[i]);
    }
$$;

select * 
from person_as_jsonb();

                     person_as_json                      
---------------------------------------------------------
 {"id": 1, "last_name": "Smith!", "first_name": "John?"}
 {"id": 2, "last_name": "Jones!", "first_name": "Phil?"}
(2 rows)

上述函数适用于非常有限的数据集。甚至不要为一百万行或更多行的整个表尝试它。

但是,您可以编写一个修改单行的函数。plv8 足够聪明,可以理解何时声明参数的自定义类型(在本例中为表名)并将其用作函数内的 json (jsonb),例如:

create or replace function modify_person(person person)
returns jsonb language plv8 as $$
    person.first_name = person.first_name+ '??';
    person.last_name = person.last_name+ '!!';
    return person;
$$;

在选择查询中使用它(Postgres 本身在此处创建一个循环,该函数分别为每一行调用):

select modify_person(person)
from person;

                       modify_person                       
-----------------------------------------------------------
 {"id": 1, "last_name": "Smith!!", "first_name": "John??"}
 {"id": 2, "last_name": "Jones!!", "first_name": "Phil??"}
(2 rows)    

请注意,您只能更改返回类型以将结果作为类型化记录(在这种情况下,您应该在 from 子句中调用该函数):

create or replace function modify_person_row(person person)
returns person language plv8 as $$
    person.first_name = person.first_name+ '??';
    person.last_name = person.last_name+ '!!';
    return person;
$$;

select modified.*
from person,
lateral modify_person_row(person) modified

 id | first_name | last_name 
----+------------+-----------
  1 | John??     | Smith!!
  2 | Phil??     | Jones!!
(2 rows)    
于 2017-07-12T03:18:31.963 回答