3

尽管像 Joomla 这样的一些主要系统将标签作为逗号分隔的文本存储在主文章数据库中,但首选三张表作为文章、标签和标签关系的规范化系统(正如 Wordpress 等其他系统所使用的那样)。有很多关于结构和阅读的讨论和问题;但我找不到最好的 INSERT 命令,因为我们需要插入三个表。如何通过一次 SQL 运行快速运行这个过程?或者我们需要先插入文章,然后每个标签,最后写关系?

另一个问题是关于标签的唯一性。这个系统的主要优点是我们只需要存储每个术语一次(然后连接到相应的文章)。使用 mysql UNIQUE 避免重复是否可行?或者(正如我在某处读到的)我们需要将整个标签列表作为数组读取,以查找任何重复项以捕获标签 ID 并避免存储该术语?

将整个过程分为三个单独的步骤:

  1. 插入文章
  2. INSERT 带有 UNIQUE 的标签,但不管它们的关系如何
  3. 查找每个标签 ID 并与文章 ID 建立关系

我对吗?我问的原因是我看到人们将标签作为数组捕获并进行比较。对我来说它非常慢,并且会影响性​​能,尤其是对于 UPDATE。

4

4 回答 4

4

您一次只能插入一个表。

一种解决方案是使用触发器,另一种是使用事务。
第一个可以与任何引擎一起使用,后者需要 InnoDB 或类似的引擎。

确保在字段上放置UNIQUE索引tag.name

1-使用交易

START TRANSACTION;

INSERT IGNORE INTO tag (name) VALUES ('$example1', '$example2');
INSERT INTO article (title, body) VALUES ('$title','$body');
SET @article_id = LAST_INSERT_ID();
INSERT INTO tag_link (tag_id, article_id) 
  SELECT t.id, @article_id FROM tag t WHERE t.name IN ('$example1','$example2');

COMMIT;

2-在黑洞表上使用触发器

创建blackhole具有以下字段的类型表。

title: varchar(255)
body: text
tag1: varchar(50) DEFAULT NULL
tag2: varchar(50) DEFAULT NULL
...
add as many tags as you want.

向黑洞表添加一个AFTER INSERT触发器,为您进行实际存储。

DELIMITER $$

CREATE TRIGGER ai_bh_newacticle_each AFTER INSERT ON bh_newacticle FOR EACH ROW
BEGIN
  INSERT IGNORE INTO tag (name) VALUES (new.tag1, new.tag2,...,new.tag25);
  INSERT INTO article (title, body) VALUES (new.title,new.body);
  SET @article_id = LAST_INSERT_ID();
  INSERT INTO tag_link (tag_id, article_id) 
    SELECT t.id, @article_id FROM tag t 
    WHERE t.name IN (new.tag1, new.tag2,...,new.tag25);
END$$

DELIMITER ;

DELIMITER $$

现在您可以在单个语句中插入带有标签的文章:

INSERT INTO bh_newarticle (title, body, tag1, tag2, tag3) 
  VALUES ('$title','$body','$tag1','$tag2','$tag3');

回到你的问题

我对吗?我问的原因是我看到人们将标签作为数组捕获并进行比较。对我来说它非常慢,并且会影响性​​能,尤其是对于 UPDATE。

标签只有在数量有限时才有用。如果你把一个(唯一的)索引放在tag.name寻找一个标签上会非常快,即使有 10.000 个标签。这是因为您正在寻找精确匹配。如果您真的很着急,您可以随时将标签表设为字段上memory带有 ahash index的表name
不过,我怀疑您是否需要担心标签查找速度缓慢。

只要确保每篇文章不允许使用太多标签。5 似乎是一个好的开始。10 太多了。

链接
http://dev.mysql.com/doc/refman/5.0/en/create-trigger.html
http://dev.mysql.com/doc/refman/5.0/en/blackhole-storage-engine.html

于 2011-09-20T15:16:54.923 回答
1

您通过发出单个查询来运行每个 INSERT,没有“解决方法”,甚至存在一个也不可行。因此,3 个表的 3 个插入。

如果您需要唯一标签,那么可以 - 最好使用 UNIQUE 约束来避免重复。

简单INSERT IGNORE的 MySQL 功能应该可以帮助您避免在插入之前记录是否存在。

于 2011-09-20T15:14:54.397 回答
1

您不能在一个语句中插入 3 个表,但可以在一个事务中运行 3 个插入语句。

我认为将标签列声明为唯一没有问题,因为您想避免重复。在将标签插入表格之前,您始终可以检查标签是否存在,或者更好的是,只需upsert标签即可。

于 2011-09-20T15:12:08.883 回答
0

有一些取决于 DBMS 功能的可能性,即:存储过程,而不是触发器,可能有任何其他方法可以使用一个 sql 语句插入,但我认为它不值得,因为即使插入所有 3 也不是那么重要table in one transaction... 保存文章但标签保存失败也不错... 但是,如果需要,存储过程是最好的任务,因为它允许复杂的逻辑,您还可以编写子程序在您的程序中执行所有 sql 并在需要时在 1 行中调用它...

您可以在标签字段上的标签表和字段(article_id,标签)上的 rel 表上创建唯一索引。

于 2011-09-20T15:24:16.393 回答