4

在我的 MySQL 数据库中,我定义了一个表,如下所示:

CREATE TABLE `mytablex_cs` (
  `id` mediumint(8) unsigned NOT NULL AUTO_INCREMENT,
  `tag` varchar(6) COLLATE utf8_bin NOT NULL DEFAULT '',
  `value` text COLLATE utf8_bin NOT NULL,
  PRIMARY KEY (`id`),
  KEY `kt` (`tag`),
  KEY `kv` (`value`(200))
) ENGINE=MyISAM AUTO_INCREMENT=7 DEFAULT CHARSET=utf8 COLLATE=utf8_bin

我需要在value字段上实现一个 UNIQUE 约束(键)。

我知道目前还不可能为blobortext字段的整个值定义唯一索引,但是有一张票(?)打开以实现此类功能(请参阅此页面),建议使用创建唯一键已经为其他字段实现了类似的哈希。

现在我想使用类似的方法向表中添加另一个包含哈希的字段并在该字段上创建唯一键。

我查看了创建此哈希的可能方法,并且由于我想避免冲突(我需要插入数百万个条目),因此 RIPEMD-160 算法似乎是最好的算法,即使快速搜索给出了我有几个使用 SHA256 甚至 SHA1 和 MD5 的类似解决方案。

我完全缺乏密码学知识,那么选择这种方法的缺点是什么?

我的另一个问题是:MySQL 当前使用哪种算法来创建哈希?

4

1 回答 1

8

让我们看看你的要求:

您需要确保值字段是唯一的。值字段是一个文本列,由于它的性质,无法在值字段上创建唯一索引(目前)。因此,使用作为字段值哈希的额外字段是您唯一真正的选择。

这种方法的优点:

  1. 易于计算哈希。
  2. 为两个不同的值创建重复哈希是极其罕见的,因此您的哈希值几乎可以保证是唯一的。
  3. 哈希通常是一些可以有效索引的数值(表示为十六进制)。
  4. 散列不会占用大量空间,不同的散列函数返回不同长度的散列,因此请使用不同的算法并测试它们以找到适合您需要的算法。

这种方法的缺点:

  1. 在插入和更新期间需要额外的字段,即还有更多的工作要做。
  2. 如果表中已经有数据并且正在生产中,则必须更新当前数据,希望您没有重复数据。运行更新也需要时间。因此,在已经运行的系统中应用更改可能会很棘手。
  3. 散列函数是 CPU 密集型的,会对 CPU 使用率产生负面影响。

我假设您了解哈希函数的作用以及概念上它是如何工作的。

您可以在此处找到加密函数列表:http: //dev.mysql.com/doc/refman/5.5/en//encryption-functions.html

据我所知,MySQL 支持 MD5、SHA、SHA1 和 SHA2 散列函数。大多数(如果不是全部)这些应该足以仅用于散列。像 MD5 这样的一些函数在密码学应用程序中使用时会出现一些问题,即在 PKI 中将其用作签名算法等时。但是,当您决定使用它来创建唯一值时,这些问题不应该那么重要,因为它并没有真正被应用在这里的密码学上下文中。

要使用 MySQL 散列函数,您可以尝试以下示例:

SELECT MD5('1234')
SELECT SHA('1234')
SELECT SHA1('1234')
SELECT SHA2('1234',224);

与所有新事物一样,您应该尝试所有方法并找到最适合您的情况的方法。

于 2012-10-03T07:40:00.257 回答