192

假设我在数据库中有一条记录,管理员和普通用户都可以进行更新。

任何人都可以建议一个好的方法/架构来控制这个表中的每一个更改,以便可以将记录回滚到以前的版本?

4

12 回答 12

182

假设您有一个FOO管理员和用户可以更新的表。大多数情况下,您可以针对 FOO 表编写查询。快乐的时光。

然后,我会创建一个FOO_HISTORY表。这具有表的所有列FOO。主键与 FOO 相同,加上一个 RevisionNumber 列。FOO_HISTORY从to有一个外键FOO。您还可以添加与修订相关的列,例如 UserId 和 RevisionDate。以不断增加的方式在所有*_HISTORY表中填充 RevisionNumbers(即来自 Oracle 序列或等价物)。不要依赖一秒钟内只有一个变化(即不要放入RevisionDate主键)。

现在,每次更新FOO时,就在更新之前将旧值插入FOO_HISTORY. 您在设计的某个基本级别上执行此操作,这样程序员就不会意外错过这一步。

如果你想从中删除一行,FOO你有一些选择。级联并删除所有历史记录,或通过标记FOO为已删除来执行逻辑删除。

当您对当前值非常感兴趣并且只是偶尔对历史感兴趣时,此解决方案非常有用。如果您总是需要历史记录,那么您可以输入有效的开始日期和结束日期,并保留所有记录FOO本身。然后,每个查询都需要检查这些日期。

于 2008-11-27T07:15:57.707 回答
47

我认为您正在寻找版本控制数据库记录的内容(就像 StackOverflow 在有人编辑问题/答案时所做的那样)。一个好的起点可能是查看一些使用修订跟踪的数据库模型。

想到的最好的例子是维基百科引擎 MediaWiki。比较这里的数据库图,尤其是修订表

根据您使用的技术,您必须找到一些好的差异/合并算法。

如果它适用于 .NET,请检查此问题。

于 2008-11-27T06:59:46.303 回答
34

在 BI 世界中,您可以通过将 startDate 和 endDate 添加到要版本化的表中来完成此操作。当您将第一条记录插入表中时,将填充 startDate,但 endDate 为空。当您插入第二条记录时,您还会将第一条记录的 endDate 更新为第二条记录的 startDate。

如果要查看当前记录,请选择 endDate 为空的记录。

这有时被称为类型 2渐变维度。另请参见TupleVersioning

于 2008-11-27T07:09:35.193 回答
9

升级到 SQL 2008。

尝试使用 SQL 2008 中的 SQL 更改跟踪。您可以使用此新功能来跟踪数据库中数据的更改,而不是时间戳和墓碑列黑客。

MSDN SQL 2008 更改跟踪

于 2008-11-28T00:36:38.637 回答
9

只是想补充一点,这个问题的一个很好的解决方案是使用Temporal database。许多数据库供应商开箱即用或通过扩展提供此功能。我已经成功地将临时表扩展与 PostgreSQL 一起使用,但其他人也有。每当您更新数据库中的记录时,数据库也会保留该记录的先前版本。

于 2015-12-10T03:29:28.690 回答
7

两种选择:

  1. 有一个历史表 - 每当更新原始数据时,将旧数据插入此历史表。
  2. 审计表 - 存储之前和之后的值 - 仅用于审计表中修改后的列以及其他信息,如更新者和时间。
于 2008-11-27T09:04:42.090 回答
5

您可以通过 SQL 触发器对 SQL 表执行审计。从触发器中,您可以访问 2 个特殊表(插入和删除)。这些表包含每次更新表时插入或删除的确切行。在触发器 SQL 中,您可以获取这些修改后的行并将它们插入到审计表中。这种方法意味着您的审计对程序员是透明的;不需要他们的努力或任何实施知识。

这种方法的额外好处是,无论 sql 操作是通过您的数据访问 DLL 还是通过手动 SQL 查询发生的,审计都会发生;(因为审计是在服务器本身上执行的)。

于 2008-11-27T12:40:17.413 回答
5

Alok 建议Audit table在上面,我想在我的帖子中解释它。

我在我的项目中采用了这种无模式的单表设计。

架构:

  • id - 整数自动增量
  • 用户名 - STRING
  • 表名 - 字符串
  • 旧值 - TEXT / JSON
  • 新值 - 文本/JSON
  • 创建时间 - DATETIME

该表可以将每个表的历史记录都保存在一个位置,在一个记录中包含完整的对象历史记录。该表可以使用触发器/钩子填充数据更改,存储目标行的旧值和新值快照。

这种设计的优点:

  • 用于历史管理的表数量较少。
  • 存储每行新旧状态的完整快照。
  • 易于在每张桌子上搜索。
  • 可以按表创建分区。
  • 可以为每个表定义数据保留策略。

这种设计的缺点:

  • 如果系统频繁更改,数据量可能很大。
于 2018-08-03T18:36:00.707 回答
4

你不说什么数据库,我在帖子标签中也没有看到。如果是针对 Oracle,我可以推荐 Designer 中内置的方法:使用日志表。如果是针对任何其他数据库,好吧,我基本上也推荐同样的方式......

它的工作方式,如果你想在另一个数据库中复制它,或者如果你只是想理解它,对于一个表来说,也创建了一个影子表,只是一个普通的数据库表,具有相同的字段规范,加上一些额外的字段:比如最后执行的操作(字符串,典型值“INS”表示插入,“UPD”表示更新,“DEL”表示删除),操作发生时间的日期时间,以及执行者的用户 ID它。

通过触发器,对表中任何行的每个操作都会在日志表中插入一个新行,其中包含新值、执行了什么操作、何时执行以及由哪个用户执行。您永远不会删除任何行(至少最近几个月不会)。是的,它会变得很大,很容易达到数百万行,但是您可以轻松地跟踪自日志开始或旧日志行最后一次清除以来的任何时间点的任何记录的值,以及最后一次更改的人。

在 Oracle 中,您需要的一切都会自动生成为 SQL 代码,您所要做的就是编译/运行它;它带有一个基本的 CRUD 应用程序(实际上只有“R”)来检查它。

于 2008-11-27T08:10:42.637 回答
2

我也在做同样的事情。我正在为课程计划制作一个数据库。这些计划需要原子更改版本控制的灵活性。换句话说,无论多么小,课程计划的每一次更改都需要被允许,但旧版本也需要保持不变。这样,课程创建者可以在学生使用课程计划时对其进行编辑。

它的工作方式是,一旦学生完成了课程,他们的结果就会附加到他们完成的版本中。如果进行了更改,他们的结果将始终指向他们的版本。

这样,如果删除或移动课程标准,其结果将不会改变。

我目前这样做的方式是处理一张表中的所有数据。通常我只有一个 id 字段,但在这个系统中,我使用了一个 id 和一个 sub_id。sub_id 通过更新和删除始终与行保持一致。id 是自动递增的。课程计划软件将链接到最新的 sub_id。学生成绩将链接到 id。我还包含了一个时间戳,用于跟踪更改发生的时间,但没有必要处理版本控制。

一旦我测试了它,我可能会改变的一件事是我可能会使用前面提到的 endDate null 想法。在我的系统中,要找到最新版本,我必须找到 max(id)。另一个系统只是寻找 endDate = null。不确定是否有另一个日期字段的好处。

我的两分钱。

于 2012-10-22T23:55:32.830 回答
2

虽然@WW。答案是一个很好的答案另一种方法是创建一个版本列并将所有版本保存在同一个表中。

对于一个表方法,您可以:

  • 使用标志来表示最新的 ala Word Press
  • 或者做一个讨厌的大于版本outer join

outer join使用修订号的方法的示例 SQL是:

SELECT tc.*
FROM text_content tc
LEFT OUTER JOIN text_content mc ON tc.path = mc.path
AND mc.revision > tc.revision
WHERE mc.revision is NULL 
AND tc.path = '/stuff' -- path in this case is our natural id.

坏消息是上面需要一个outer join并且外部连接可能很慢。好消息是理论上创建新条目更便宜,因为您可以在没有事务的情况下在一次写入操作中完成(假设您的数据库是原子的)。

进行新修订的示例'/stuff'可能是:

INSERT INTO text_content (id, path, data, revision, revision_comment, enabled, create_time, update_time)
(
SELECT
(md5(random()::text)) -- {id}
, tc.path
, 'NEW' -- {data}
, (tc.revision + 1)
, 'UPDATE' -- {comment}
, 't' -- {enabled}
, tc.create_time
, now() 
FROM text_content tc
LEFT OUTER JOIN text_content mc ON tc.path = mc.path
AND mc.revision > tc.revision
WHERE mc.revision is NULL 
AND tc.path = '/stuff' -- {path}
)

我们使用旧数据插入。如果您只想更新一列并避免乐观锁定和/或事务,这将特别有用。

标志方法和历史表方法需要插入/更新行。

修订号方法的另一个优点outer join是,您以后可以随时使用触发器重构为多表方法,因为您的触发器本质上应该执行上述操作。

于 2012-11-28T02:25:30.097 回答
0

作为我上面答案的附加步骤,我建议给每个生成的更改一个唯一的 ID,可能是日期/时间和每天的唯一计数器(这样一秒钟的多个更新不会重叠)。我将在此代码中包含一个操作类型代码,即“9129128213939REPLACE”。这提供了一种稳健性,以允许完整性检查您的其他历史系统是否正常工作。

于 2020-11-01T16:37:21.913 回答