2

我将 AdWords 报告数据存储在 Postgres 中。每个报告都存储在一个名为 Reports 的表中,该表有一个名为“data”的 jsonb 列。每个报告都将 json 存储在其“数据”字段中,如下所示:

[
  {
    match_type: "exact",
    search_query: "gm hubcaps",
    conversions: 2,
    cost: 1.24
  },
  {
    match_type: "broad",
    search_query: "gm auto parts",
    conversions: 34,
    cost: 21.33
  },
  {
    match_type: "phrase",
    search_query: "silverdo headlights",
    conversions: 63,
    cost: 244.05
  }
]

我想要做的是查询这些数据哈希并总结给定报告的转换总数。我查看了 Postgresql 文档,看起来你只能对哈希进行计算,而不是像这样的哈希数组。我正在尝试在 postgres 中做些什么?我需要用这个数组制作一个临时表并计算它吗?或者我可以使用存储过程吗?

我正在使用 Postgresql 9.4

编辑 我不只是使用常规的规范化表格的原因是,这只是报告数据如何构造的一个示例。在我的项目中,报告必须允许任意键,因为它们是由用户上传 CSV 和他们喜欢的任何列来填充的。它基本上只是一种解决任意数量的用户创建表的方法。

4

2 回答 2

1

我想要做的是查询这些数据哈希并总结转换

最快的方法应该是 with jsonb_populate_recordset()。但是你需要一个注册的行类型。

CREATE TEMP TABLE report_data (
--   match_type text    -- commented out, because we only need ..
-- , search_query text  -- .. conversions for this query
     conversions int
-- , cost numeric
);

临时表是注册行类型 ad-hoc 的一种方法。此相关答案中的更多解释:

由于缺少信息,假设一个report带有report_idPK 的表。

SELECT r.report_id, sum(d.conversions) AS sum_conversions
FROM   report r
LEFT   JOIN LATERAL jsonb_populate_recordset(null::report_data, r.data) d ON true
-- WHERE  r.report_id = 12345  -- only for given report?
GROUP  BY 1;

确保您获得结果LEFT JOIN,即使data是 NULL 或空或 JSON 数组为空。

对于基础表中单行的总和,这更快:

SELECT d.sum_conversions
FROM   report r
LEFT   JOIN LATERAL (
   SELECT sum(conversions) AS sum_conversions
   FROM   jsonb_populate_recordset(null::report_data, r.data)
   ) d ON true
WHERE  r.report_id = 12345;  -- enter report_id here

替代方案jsonb_array_elements()(不需要注册的行类型):

SELECT d.sum_conversions
FROM   report r
LEFT   JOIN LATERAL (
   SELECT sum((value->>'conversions')::int) AS sum_conversions
   FROM   jsonb_array_elements(r.data)
   ) d ON true
WHERE  r.report_id = 12345;  -- enter report_id here

通常,您会将其实现为普通的规范化表。我在这里看不到 JSON 的好处(除了您的应用程序似乎需要它,就像您添加的那样)。

于 2015-03-19T15:19:33.137 回答
1

你可以使用unnest

select sum(conv) from
(select d->'conversion' as conv from
(select unnest(data) as d from <your table>) all_data
) all_conv

免责声明:我没有 Pg 9.2,所以我无法自己测试。

编辑:这是假设您提到的数组是 Postgresql 数组,即您的data列的数据类型是character varying[]. 如果您的意思data是 json 数组,您应该可以使用json_array_elements而不是unnest.

于 2015-03-19T14:36:33.913 回答