1

我目前正在开发一个基于 MySQL 的网站,但如果需要(如 CTE 左右)切换到另一个数据库不是问题。

我正在寻找最好的数据库数据结构(如果可能的话,还有一些 SQL 片段)来处理我当前的项目,如下所示:

  • 一个产品可以由其他产品组成(递归地),因此产品必须以面向树的架构设计。
  • 一个产品可以用于制造许多产品。这就是像嵌套集架构这样的东西不起作用的地方,因为一个节点可以是许多节点的子节点和父节点,这似乎使用 NestedSet 是不可能的。
  • 一种产品每天都有可用的数量,但前提是它是“叶子”(它不是由其他产品制成的)。否则,它的数量将取决于其直接子代的数量(依此类推,直到递归到达叶子)。所以产品可以链接到一个表“availability”,其中包含“product_id”、“date”和“quantity”。

产品的“树”结构相当稳定,因此更新/插入/删除查询的速度并不重要。

最终目标是能够在 SELECT 查询中尽可能快地检索指定的两个日期之间可用的所有产品的列表。

这意味着:

  • 1) 如果产品不是由其他产品制成,则在两个日期之间的每一天数量 > 0 时可用。
  • 2) 如果产品是由其他产品制成的,则只有当 (1) 对其所有子产品都成立时,它才可用。如果直接子节点不是“叶子”,则它们将没有数量,因此(2)的递归将发生,直到它到达最后的叶子。

顺便说一句,在真实案例中,我的产品的深度永远不会超过 5 级。将所有父 ID 存储在单独的列中可能是一个好(但非常丑陋)的想法。

4

1 回答 1

8

您描述的数据结构不是棵树(它要求每个节点都只有一个父节点,除了没有父节点的根节点):相反,它是一个更一般的DAG

有向无环图

其他 RDBMS 原生支持分层数据和递归查询,而 MySQL 没有;相反,在 MySQL 中存储此类数据的一个很好的通用关系模型是创建一个图的传递闭包表。用作//语句分隔符:

CREATE TABLE Products (
  SKU         SERIAL                COMMENT 'Stock-Keeping Unit code',
  Name        VARCHAR(15)           COMMENT 'Product name',
  Description VARCHAR(255)          COMMENT 'Descriptive text',
  Price       DECIMAL(6,2)          COMMENT 'Selling price',
  isAtomic    BOOLEAN DEFAULT FALSE COMMENT 'Flag indicating atomicity'
)
  ENGINE  = InnoDB,
  COMMENT = 'Properties relating to each product'
//

CREATE TABLE ProductComponents (
  SKU          BIGINT UNSIGNED NOT NULL COMMENT 'Stock-Keeping Unit Code',
  ComponentSKU BIGINT UNSIGNED NOT NULL COMMENT 'SKU of comprised component',
  PRIMARY KEY (SKU, ComponentSKU),
  INDEX       (ComponentSKU, SKU),
  FOREIGN KEY (         SKU) REFERENCES Products (SKU),
  FOREIGN KEY (ComponentSKU) REFERENCES Products (SKU)
)
  ENGINE  = InnoDB,
  COMMENT = 'Transitive closure of the product DAG'
//

可以使用触发器在后一个表中强制执行原子性:

CREATE TRIGGER ins_atomic BEFORE INSERT ON ProductComponents
FOR EACH ROW IF
  NEW.SKU <> NEW.ComponentSKU
  AND (SELECT isAtomic FROM Products WHERE SKU = NEW.SKU)
THEN
  SIGNAL SQLSTATE '45000' SET
    MESSAGE_TEXT = 'Atomic product cannot have a component'
  ;
END IF//

CREATE TRIGGER upd_atomic BEFORE UPDATE ON ProductComponents
FOR EACH ROW IF
  NEW.SKU <> NEW.ComponentSKU
  AND (SELECT isAtomic FROM Products WHERE SKU = NEW.SKU)
THEN
  SIGNAL SQLSTATE '45000' SET
    MESSAGE_TEXT = 'Atomic product cannot have a component'
  ;
END IF//

您可能还需要一个类似的触发器来防止错误更新Products.isAtomic

CREATE TRIGGER upd_prod BEFORE UPDATE ON Products
FOR EACH ROW IF NEW.isAtomic AND EXISTS (
  SELECT * FROM ProductComponents WHERE SKU <> ComponentSKU AND SKU = NEW.SKU
) THEN
  SIGNAL SQLSTATE '45000' SET
    MESSAGE_TEXT = 'Atomic product cannot have a component'
  ;
END IF//

对于上面描述的图表,您的数据将如下所示:

INSERT INTO Products
  (SKU, isAtomic)
VALUES
  (  2, TRUE    ),
  (  3, FALSE   ),
  (  5, FALSE   ),
  (  7, FALSE   ),
  (  8, FALSE   ),
  (  9, TRUE    ),
  ( 10, TRUE    ),
  ( 11, FALSE   )
//

INSERT INTO ProductComponents
  (SKU, ComponentSKU)
VALUES
  (2,2),
  (3,3),   (3,8),   (3,9),   (3,10),
  (5,5),   (5,11),  (5,2),   (5,9),   (5,10),
  (7,7),   (7,8),   (7,9),   (7,11),  (7,2),   (7,10),
  (8,8),   (8,9),
  (9,9),
  (10,10),
  (11,11), (11,2),  (11,9),  (11,10)
//

然后您可以按如下方式存储可用性:

CREATE TABLE ProductAvailability (
  SKU      BIGINT UNSIGNED NOT NULL COMMENT 'Stock-Keeping Unit Code',
  Date     DATE                     COMMENT 'Availability date',
  Quantity INT                      COMMENT 'Available quantity',
  PRIMARY KEY (SKU, Date),
  FOREIGN KEY (SKU) REFERENCES Products (SKU)
)
  ENGINE  = InnoDB,
  COMMENT = 'Available quantities'
//

以上的一些测试数据可能是:

INSERT INTO ProductAvailability
  (SKU, Date        , Quantity)
VALUES
  (  2, '2012-12-13',     NULL),
  (  2, '2012-12-15',       15),
  (  9, '2012-12-13',      234),
  (  9, '2012-12-14',       46),
  (  9, '2012-12-15',        0),
  ( 10, '2012-12-13',        4),
  ( 10, '2012-12-14',        7),
  ( 10, '2012-12-15',        5)
//

您的查询将是:

SELECT   p.*
FROM     Products p
    JOIN ProductComponents c USING (SKU)
    JOIN (
           SELECT   p.SKU AS ComponentSKU,
                    COUNT(*) = DATEDIFF(@end_date, @start_date) + 1 AS available
           FROM     Products p LEFT JOIN ProductAvailability a
                 ON a.SKU = p.SKU
                AND a.Quantity > 0
                AND a.Date BETWEEN @start_date AND @end_date
           WHERE    p.isAtomic
           GROUP BY p.SKU
         ) q USING (ComponentSKU)
GROUP BY p.SKU
HAVING   NOT SUM(q.available = 0)

sqlfiddle上查看。

于 2012-12-13T18:35:33.147 回答