1

我在一个 Postgres 数据库中有两个表,表示来自市场的简单订单。一个包含订单信息的主表和一个包含购买细节的详细表,外键返回到主表。很容易。

来自市场的数千个订单,我想根据购买的内容和数量找到一些特定的订单。

我还有两张桌子,以类似的方式,一个主人和一个孩子,在那里我从市场上创建一个“包装”和细节项目。

例如:包装A 包含 2 个苹果和 3 个橙子。我在表格中定义。现在我想知道有多少订单,以及来自市场的哪些订单与该特定组合完全匹配。

重要的是它是完全匹配的。包含额外产品或任何不同数量的订单不匹配。

在 SQL Fiddle 中,我使用数据设置了简单示例。原始 DDL 如下。表中的两个订单应与包装 A 匹配。

http://sqlfiddle.com/#!17/b4f55

CREATE TABLE customer_order(
 order_id serial PRIMARY KEY NOT NULL,
 customer_name VARCHAR(100) NOT NULL
);

CREATE TABLE order_detail(
    id serial PRIMARY KEY,
    order_id INTEGER,
    item_sku VARCHAR(50),
    item_quantity INTEGER,
    FOREIGN KEY(order_id) REFERENCES customer_order(order_id)
);

INSERT INTO customer_order (customer_name) VALUES ('John');
INSERT INTO customer_order (customer_name) VALUES ('Mary');
INSERT INTO customer_order (customer_name) VALUES ('Bill');

INSERT INTO order_detail (order_id, item_sku, item_quantity) VALUES (1, 'APPLE', 2);
INSERT INTO order_detail (order_id, item_sku, item_quantity) VALUES (1, 'ORANGE', 3);
INSERT INTO order_detail (order_id, item_sku, item_quantity) VALUES (2, 'ORANGE', 5);
INSERT INTO order_detail (order_id, item_sku, item_quantity) VALUES (3, 'APPLE', 2);
INSERT INTO order_detail (order_id, item_sku, item_quantity) VALUES (3, 'ORANGE', 3);

CREATE TABLE pack_master(
 pack_id serial PRIMARY KEY NOT NULL,
 name VARCHAR(100) NOT NULL
);

CREATE TABLE pack_child(
    id serial PRIMARY KEY,
    pack_id INTEGER,
    item_sku VARCHAR(50),
    item_quantity INTEGER,
    FOREIGN KEY(pack_id) REFERENCES pack_master(pack_id)
);

INSERT INTO pack_master (name) VALUES ('Pack A');
INSERT INTO pack_master (name) VALUES ('Pack B');

INSERT INTO pack_child (pack_id, item_sku, item_quantity) VALUES (1, 'APPLE', 2);
INSERT INTO pack_child (pack_id, item_sku, item_quantity) VALUES (1, 'ORANGE', 3);
INSERT INTO pack_child (pack_id, item_sku, item_quantity) VALUES (2, 'GRAPES', 5);
4

2 回答 2

2

假设pack_child (pack_id, item_sku),以及 order_detail (order_id, item_sku)定义UNIQUE,这将起作用:

SELECT pc.pack_id, od.order_id
FROM   pack_child pc
LEFT   JOIN order_detail od USING (item_sku, item_quantity)
GROUP  BY 1, 2
HAVING count(*) = count(od.id)  -- every item of the pack has a match
AND    NOT EXISTS (
   SELECT
   FROM   order_detail od1
   LEFT   JOIN pack_child pc1 ON pc1.item_sku = od1.item_sku
                             AND pc1.item_quantity = od1.item_quantity
                             AND pc1.pack_id = pc.pack_id
   WHERE  od1.order_id = od.order_id
   AND    pc1.id IS NULL       -- and order has no additional item
   );

返回完全匹配的所有pack_id和对order_id

db<>在这里摆弄

有一百零一种编写查询的替代方法。哪个最快取决于基数、数据分布、约束,最重要的是,可用索引。

的特殊应用。这是一个技术库:

一种替代方法,可能更快:创建父表的视图或物化视图,包括项目计数:

CREATE MATERIALIZED VIEW v_pack_master AS
SELECT *
FROM   pack_master
JOIN  (
   SELECT pack_id, count(*) AS items
   FROM   pack_child
   GROUP  BY 1
   ) c USING (pack_id);

CREATE MATERIALIZED VIEW v_customer_order AS
SELECT *
FROM   customer_order
JOIN  (
   SELECT order_id, count(*) AS items
   FROM   order_detail
   GROUP  BY 1
   ) c USING (order_id);

(订单通常不会在以后更改,因此可能是物化视图的可行候选者。)

只有当可以有许多订单项目时,索引才可能支付(此顺序的索引表达式):

CREATE INDEX foo ON v_customer_order (items, order_id);

该查询现在只考虑具有匹配项目计数的订单以:

SELECT * -- pack_id, order_id
FROM   v_pack_master pm
LEFT   JOIN v_customer_order co USING (items)
JOIN   LATERAL (
   SELECT count(*) AS items
   FROM   pack_child pc
   JOIN   order_detail od USING (item_sku, item_quantity)
   WHERE  pc.pack_id  = pm.pack_id
   AND    od.order_id = co.order_id
   ) x USING (items);

..那么,如果所有项目都匹配,我们不必再排除其他项目。而且我们可以立即使用父表中的所有列,以返回您想要返回的任何内容......

于 2018-12-21T05:52:42.407 回答
0

我想知道有多少订单,以及来自市场的哪些订单与该特定组合相匹配。

据此,我假设由于您有 2 个数量为 2 的苹果订单和 2 个数量为 2 的橙色订单,您的结果应该类似于下表,因为它们存在于具有相同 item_sku 和数量的包中。

 item_sku  | Count
   --------+------
    Apple  | 2
    Orange | 2

SQL:

SELECT OD.item_sku, count(OD.item_sku)
FROM order_detail as OD
JOIN pack_child as PC
ON OD.item_sku = PC.item_sku
WHERE OD.item_sku = PC.item_sku AND (OD.item_quantity = PC.item_quantity)
GROUP BY OD.item_sku
于 2018-12-21T06:03:55.053 回答