5

我有三个控制产品、颜色和尺寸的表。产品可以有或没有颜色和尺寸。颜色可以有大小,也可以没有。

product      color                           size
-------      -------                         -------
id           id                              id
unique_id    id_product (FK from product)    id_product (FK from version)
stock        unique_id                       id_version (FK from version)
title        stock                           unique_id
                                             stock

unique_id列存在于所有表中,是串行类型(自动增量),其计数器与三个表共享,基本上它作为它们之间的全局唯一 ID。

它工作正常,但是当我必须选择一些基于unique_id.

因为我不知道我在哪里unique_id寻找,我正在使用UNION,如下所示:

select title, stock
from product 
where unique_id = 10

UNION

select p.title, c.stock
from color c
join product p on c.id_product = p.id
where c.unique_id = 10

UNION

select p.title, s.stock
from size s
join product p on s.id_product = p.id
where s.unique_id = 10;

有一个更好的方法吗?感谢您的任何建议!

编辑 1

基于@ErwinBrandstetter 和@ErikE 的回答,我决定使用以下查询。主要原因是:

1)由于unique_id所有表中都有索引,我将获得良好的性能

2)使用unique_id我会找到产品代码,所以我可以使用另一个简单的连接来获取我需要的所有列

SELECT 

    p.title,
    ps.stock

FROM (

    select id as id_product, stock
    from product 
    where unique_id = 10

    UNION

    select id_product, stock
    from color
    where unique_id = 10

    UNION

    select id_product, stock
    from size
    where unique_id = 10

) AS ps

JOIN product p ON ps.id_product = p.id;
4

5 回答 5

5

PL/pgSQL 函数

为了解决手头的问题,如下所示的 plpgsql 函数应该更快:

CREATE OR REPLACE FUNCTION func(int)
  RETURNS TABLE (title text, stock int) LANGUAGE plpgsql AS
$BODY$
BEGIN

RETURN QUERY
SELECT p.title, p.stock
FROM   product p
WHERE  p.unique_id = $1; -- Put the most likely table first.

IF NOT FOUND THEN
    RETURN QUERY
    SELECT p.title, c.stock
    FROM   color c
    JOIN   product p ON c.id_product = p.id
    WHERE  c.unique_id = $1;
END;

IF NOT FOUND THEN
    RETURN QUERY
    SELECT p.title, s.stock
    FROM   size s
    JOIN   product p ON s.id_product = p.id
    WHERE  s.unique_id = $1;
END IF;

END;
$BODY$;

更新了具有表限定列名的函数,以避免与OUT参数的命名冲突。

RETURNS TABLE需要 PostgreSQL 8.4,RETURN QUERY需要版本 8.2。您可以将两者都替换为旧版本。

不用说,您需要索引每个相关表的列unique_idid应该自动索引,作为主键。


重新设计

理想情况下,您可以仅从 ID 中分辨出哪个表。您可以继续使用一个通用序列,但100000000为第一个表、200000000第二个表和300000000第三个表添加 - 或任何适合您需要的表。这样,数字中最不重要的部分就很容易区分。

一个普通整数的范围从 -2147483648 到 +2147483647,bigint如果这对您来说还不够,请移至。integer不过,如果可能的话,我会坚持使用ID。它们比bigintor更小更快text


CTE(实验性!)

如果由于某种原因无法创建函数,这个纯 SQL 解决方案可能会做类似的伎俩:

WITH x(uid) AS (SELECT 10) -- provide unique_id here
    , a AS (
    SELECT title, stock
    FROM   x, product 
    WHERE  unique_id = x.uid
    )
    , b AS (
    SELECT p.title, c.stock
    FROM   x, color c
    JOIN   product p ON c.id_product = p.id
    WHERE  NOT EXISTS (SELECT 1 FROM a)
    AND    c.unique_id = x.uid
    )
    , c AS (
    SELECT p.title, s.stock
    FROM   x, size s
    JOIN   product p ON s.id_product = p.id
    WHERE  NOT EXISTS (SELECT 1 FROM b)
    AND    s.unique_id = x.uid
    )
SELECT * FROM a
UNION ALL
SELECT * FROM b
UNION ALL
SELECT * FROM c;

不确定它是否能像我希望的那样避免额外的扫描。将不得不进行测试。此查询至少需要 PostgreSQL 8.4。


升级!

正如我刚刚了解到的,OP 在 PostgreSQL 8.1 上运行。
单独升级会大大加快操作速度。


查询 PostgreSQL 8.1

由于您的选择有限,并且无法使用 plpgsql 函数,因此该函数的性能应该比您拥有的要好。测试EXPLAIN ANALYZE - 在 v8.1 中可用。

SELECT title, stock
FROM   product 
WHERE  unique_id = 10

UNION ALL
SELECT p.title, ps.stock
FROM   product p
JOIN  (
    SELECT id_product, stock
    FROM   color
    WHERE  unique_id = 10

    UNION ALL
    SELECT id_product, stock
    FROM   size
    WHERE  unique_id = 10
    ) ps ON ps.id_product = p.id;
于 2012-07-10T21:55:45.627 回答
3

我认为是时候重新设计了。

您有一些东西被用作物品的条形码,这些物品在一个方面基本相同(它们是 SerialNumberItems),但由于它们在其他方面不同而被分成多个表。

我有几个想法给你:

更改默认值

只需使每个产品都需要一种颜色“无颜色”和一种尺寸“无尺寸”。然后你可以查询任何你想找到你需要的信息的表。

超类型/子类型

无需太多修改,您就可以使用超类型/子类型数据库设计模式。

在其中,有一个父表,其中所有不同的详细级别标识符都存在,子类型表的共享列进入超类型表(所有项目都相同的方式)。对于项目不同的每种不同方式,都有一个子类型表。如果需要子类型的互斥性(您可以有颜色或大小,但不能同时具有两者),则为父表指定一个 TypeID 列,并且子类型表对 ParentID 和 TypeID 都有一个 FK。查看您的设计,实际上您不会使用互斥性。

如果您使用超类型表的模式,您确实会遇到必须插入两部分的问题,首先是超类型,然后是子类型。删除也需要以相反的顺序删除。但是,您可以通过单个查询从超类型表中获取基本信息,例如 Title 和 Stock。

您甚至可以为每个子类型创建模式绑定视图,使用将插入、更新和删除转换为基表 + 子表上的操作的而不是触发器。

更大的重新设计

您可以完全改变颜色和尺寸与产品的关系。

首先,您的“has-a”模式如下:

  • 产品(什么都没有)
  • 产品->颜色
  • 产品->尺寸
  • 产品->颜色->尺寸

这里有一个问题。显然产品是具有其他东西(颜色和尺寸)但颜色没有尺寸的主要项目!那是任意分配。您可能会说尺寸有颜色 - 它没有任何区别。这表明您的表设计可能不是最好的,因为您正在尝试以父子类型的关系对正交数据进行建模。真的,产品有 ColorAndSize。

此外,当产品有颜色和尺寸时,uniqueid颜色表中的 是什么意思?可以订购没有尺寸、只有颜色的产品吗?这种设计为(在我看来)不应该被订购的东西分配了一个唯一的 ID——但是您无法从颜色表中找到此信息,您必须先比较颜色和尺寸表。这是一个问题。

我会将其设计为: Table Product。表格Size列出了任何产品可能的所有不同尺寸。表格Color列出了任何产品可能的所有不同颜色。以及包含、、和(您的条形码值)OrderableProduct列的表。此外,每件商品都必须有一种颜色和一种尺寸,否则就不存在。ProductIdColorIDSizeIDUniqueID

基本上,Color 和 Size 就像 X 和 Y 坐标成一个网格;您正在填写允许组合的框。哪一个是行,哪一个列是不相关的。当然,一个不是另一个的孩子。

如果有任何合理的规则,一般来说,关于哪些颜色或尺寸可以应用于各种产品子组,那么 ProductType 表和 ProductTypeOrderables 表中可能有实用程序,当创建新产品时,可以填充 OrderableProduct带有标准集的表——它仍然可以自定义,但可能比重新创建更容易修改。或者,它可以定义允许的颜色和尺寸范围。您可能需要单独的 ProductTypeAllowedColor 和 ProductTypeAllowedSize 表。例如,如果您销售 T 恤,您可能希望允许 XXXS、XXS、XS、S、M、L、XL、XXL、XXXL 和 XXXXL,即使大多数产品从未使用所有这些尺寸。但是对于软饮料,尺寸可能是 6 包 8 盎司、24 包 8 盎司、2 升等,

在这个新方案中,您只需查询一个表即可找到正确的可订购产品。有了适当的索引,它应该会很快。

你的问题

您询问:

在 PostgreSQL 中,所以你认为如果我在 unique_id 上使用索引,我会获得令人满意的性能吗?

您用于重复查找数据的任何列或列集都必须具有索引!任何其他模式每次都会导致全表扫描,这将是糟糕的性能。我确信这些索引将使您的查询闪电般快速,因为每个表只需要一次叶级读取。

于 2012-07-10T22:30:47.420 回答
1

使用三个单独的 auto_increment 列生成唯一 ID 有一种更简单的方法。只需在 ID 前面加上一个字母即可使其唯一:

颜色:

 C0000001
 C0000002
 C0000003

尺寸:

 S0000001
 S0000002
 S0000003
 ...

产品:

 P0000001
 P0000002
 P0000003
 ...

几个优点:

  • 您不需要跨表序列化 id 的创建以确保唯一性。这将提供更好的性能。
  • 您实际上不需要将字母存储在表中。同一张表中的所有ID都以相同的字母开头,因此您只需要存储数字即可。这意味着您可以使用普通auto_increment列来生成您的 ID。
  • 如果您有一个 ID,您只需检查第一个字符即可查看可以在哪个表中找到它。如果您只想知道它是产品 ID 还是尺寸,您甚至不需要查询数据库ID。

一个缺点:

  • 它不再是一个数字。但是你可以通过使用 1,2,3 而不是 C,S,P 来解决这个问题。
于 2012-07-10T21:54:04.590 回答
1

只要您在unique_id, 每个表上都有索引,并且在连接列上有索引,您的查询将非常有效。

对于此查询,您可以将它们UNION转换为UNION ALL但性能没有任何差异。

于 2012-07-10T22:05:37.463 回答
1

这有点不同。如果库存存在于多个 {product,color,zsize} 表中,我不理解预期的行为。(UNION 将删除重复项,但对于整个行,例如 {product_id,stock} 元组。这对我来说毫无意义。我只取第一个。(注意时髦的自加入!!)

SELECT p.title
        , COALESCE (p2.stock, c.stock, s.stock) AS stock
FROM product p
LEFT JOIN product p2 on p2.id = p.id AND p2.unique_id = 10
LEFT JOIN color c on c.id_product = p.id AND c.unique_id = 10
LEFT JOIN zsize s on s.id_product = p.id AND s.unique_id = 10
WHERE COALESCE (p2.stock, c.stock, s.stock) IS NOT NULL
        ;
于 2012-07-11T16:26:48.350 回答