4

我对标签数据库模式的 Toxi 解决方案有点头疼。我正在开发一个用户可以提交项目的系统,这些项目可以有与之关联的标签。在阅读了 tagschemas 之后,我发现 Toxi 解决方案最适合我的需求。但是,我不完全确定我的计划是否正确,所以我想请您对此发表意见。

我将拥有三个数据库。
items包含item_id和其他人
tagmap使用item_idtag_id作为外键
tags包含tag_idtag_text

添加新项目时,我是否可以假设将标签添加到数据库的过程如下?

  1. 将提交的标签排序到数组中
  2. 对于数组中的每个标签:
    1. 从 tag_text 与当前标签匹配的标签中获取 tag_id
    2. 如果返回 0 行:
      1. 将标签添加到标签表
      2. 获取 tag_id
    3. 将 item_id 和 tag_id 添加到 tagmap
  3. 完成(给用户一个好的,等等)

这意味着我们最终会在标签映射中为每个项目的每个标签创建一个条目。这似乎是正确的,但我不禁认为有更好的方法来做到这一点,而不是在那里结束大量的条目......

至于编辑标签,我已经想到了以下过程,虽然我认为我还没有找到更好的方法。

  1. 使用 item_id 获取标签并插入可编辑字段
  2. 用户进行更改。提交时:
  3. 从 tagmap 中删除 item_id 与正在编辑的行匹配的行
  4. 与上面列出的过程相同

我对那里的第 3 点有点怀疑。有没有办法让我检查是否有任何标签已被删除,这样我就可以有选择地删除标签,而不仅仅是删除并重新添加它们?只是为了确定:当删除标记映射行时,相关项目不会被删除,因为它指向一个外键而不是一个外键,对吧?

此外,我可能想跟踪使用标签的次数,但我不想运行查询来计算每次需要显示的次数。我正在考虑让 cron 作业每小时或每两小时计算一次 tagmap 中每个 tag_id 的实例数,然后更新 tags 表中的 tag_use 值。这是正确的方法,还是有更好的方法?

回想起来,那是相当大量的文字。Welp,与其说太详细,不如说漏掉信息,与其问太少,不如问太多问题,学很多新东西。好机会我今天花了太多时间研究这个,明天一切都会变得更有意义。

提前致谢!

4

1 回答 1

15

首先,“毒”不是一个标准术语。始终定义您的条款!或者至少提供相关链接。

现在到问题本身......

我将拥有三个数据库。

不,您将有 3 张桌子。

添加新项目时...

您几乎走在正确的轨道上,除了您可以使用 SQL 的基于集合的特性来“合并”其中的许多步骤。例如,用标签标记项目 1:'tag1'、'tag2' 和 'tag3' 可以这样完成......

INSERT IGNORE INTO tagmap (item_id, tag_id)
SELECT 1, tag_id FROM tags WHERE tag_text IN ('tag1', 'tag2', 'tag3');

IGNORE即使 item 已经连接到这些标签中的某些标签,它也允许此操作成功。

这假设所有必需的标签都已经在tags. 假设tag.tag_id是自动增量,您可以执行以下操作以确保它们是:

INSERT IGNORE INTO tags (tag_text) VALUES ('tag1'), ('tag2'), ('tag3');

这意味着我们最终会在标签映射中为每个项目的每个标签创建一个条目。这似乎是正确的,但我不禁认为有一种更好的方法可以做到这一点,然后在那里有大量的条目......

没有魔法。如果“项目连接到特定标签”是您要记录的知识,那么它必须在数据库中具有某种物理表示。

至于编辑标签...

您的意思是重新标记项目(不修改标签本身)?

要删除不在列表中的所有标签,请执行以下操作:

DELETE FROM tagmap
WHERE
    item_id = 1
    AND tag_id NOT IN (
        SELECT tag_id FROM tags
        WHERE tag_text IN ('tag1', 'tag3')
    );

这将断开该项目与除“tag1”和“tag3”之外的所有标签。依次执行上面的 INSERT 和 DELETE 以“覆盖”添加和删除标签。

您可以在SQL Fiddle中使用所有这些。

只是为了确定:当删除标记映射行时,相关项目不会被删除,因为它指向一个外键而不是一个外键,对吧?

正确的。FK 的子端点不会触发引用操作(例如 ON DELETE CASCADE),只有父端点会。

顺便说一句,您使用此模式是因为您想要tags(旁边tag_text)中的其他字段,对吗?如果你这样做了,不要仅仅因为所有连接都消失而丢失这些额外的数据是期望的行为。

但是,如果您只想要tag_text,您将使用更简单的模式,其中删除所有连接与删除标签本身相同:

在此处输入图像描述

这不仅会简化 SQL,还会提供更好的集群

乍一看,“toxi”可能看起来像是在节省空间,但实际上可能并非如此,因为它需要额外的表和索引(并且标签往往很短)。

另外,我可能想跟踪标签的次数...... cron 作业......

在你决定做这样的事情之前进行测量。上面提到的我的 SQL Fiddle 在 PK 中使用了非常慎重的字段顺序tagmap,因此数据以一种对这种计数非常友好的方式聚集在一起(记住:InnoDB 表是聚集的)。在这成为问题之前,您必须拥有真正大量的项目(或需要异常高的性能)。

无论如何,测量真实的数据量!

于 2012-05-09T19:01:32.437 回答