12

语境

Web 应用程序,PHP 5,MySQL 5.0.91

问题

我最近从使用自动递增整数切换到 UUID 作为我的某些表的主键。通过 MySQL 的UUID()函数生成 UUID 时,它们非常相似:

| uuid                                 |
----------------------------------------
| 1e5988da-afec-11e1-9877-5464f7aa6d24 |
| 408092aa-afad-11e1-9877-5464f7aa6d24 |
  ^------^   ^^
  1      8   11-12

可以看到,只有前 8 个字符和第 11 个和第 12 个字符不同。我了解 UUID 版本 1 使用时间戳和硬件 MAC 地址来生成 UUID。但是,由于这些相似之处(以及在我的情况下 MAC 地址永远不会改变的事实),我在使用版本 1 时犹豫不决。此外,如果 MAC 地址永远不会改变,那么大部分 UUID 都是无用的,而且是在浪费空间。

我的自定义 UUID 函数

作为一个实验,我用 PHP 编写了一个自定义 UUID 生成器:

public static function GenerateUUID()
{
    return
    substr(sha1(Account::GetUsername() . Account::GetUserID()), 18, 8) . "-" .
    substr(md5(time()), rand() % 28, 4) . "-" . 
    substr(md5(date("Y")), rand() % 28, 4) . "-" . 
    substr(sha1(rand()), 20, 4) . "-" . 
    substr(sha1(rand() % PHP_INT_MAX), 17, 12);
}

结果样本:

| uuid                                 |
----------------------------------------
| 574d18c2-5080-bac9-5597-45435f363ea1 |
| 574d18c2-30d4-8b5b-4ffd-001744d3d287 |

在这里,前 8 个字符对于同一个用户是相同的。这是有意的,但不是必需的。

问题

是否有首选/推荐的方式在 MySQL 查询中生成版本 4 或版本 5 UUID ?

如果不是,是否可以在 PHP(如上)中生成不符合规范的自定义 UUID?

限制

  • 我正在使用具有命令行访问权限的共享主机计划,但无法修改现有的 MySQL 安装。
  • 我宁愿避免使用第三方包/库。

笔记

  • 我不会也不会执行合并、同步或其他需要包含 MAC 地址的 GUID 的操作。这不是这里的问题。
4

2 回答 2

11

您担心“大多数 UUID 无用且浪费空间”是数据类型大小所固有的。您将永远无法在数据库中拥有与 16 字节的理论限制所允许的一样多的条目。

事实上,如果将 UUID 用作表 ID,V1 UUID 比 V4 更合适——因为它使用 MAC 地址和时间戳来防止冲突。在 V4 中没有这样的机制,尽管实际上您也不需要过多担心冲突 :) 如果您需要使 UUID 不可预测,则应该使用 V4 UUID 而不是 V1。

另外,请注意,组合例如 4x4 字节的随机值可能与创建 16 字节的随机值不同。与加密和随机性一样:我不建议您实现自己的 UUID::V4 例程。

如果安装在您的机器上,您可以使用该php-uuid软件包。

可以在此处找到示例代码(可以在您的应用程序中使用): http ://rommelsantor.com/clog/2012/02/23/generate-uuid-in-php/

像这样使用它:

$uuid = uuid_create(1);

能够在其网络服务器上安装软件包的用户可以安装所需的软件包,例如:(此处为 ubuntu)

apt-get install php5-dev uuid-dev
pecl install uuid
于 2012-06-14T20:33:43.480 回答
4

欣赏拥有“相似部分”实际上是一个相当不错的主意。它将允许您利用 MAC 地址来识别“我的哪些服务器生成了此 UUID?”......这在远程位置之间迁移数据时非常有用。您甚至可以通过这种方式做到“这是我的测试数据”和“这是我的生产数据”。

PHP 有大量的 UUID 生成器库。

这是一件 PECL/PEAR 的事情(我从未使用过):

http://pecl.php.net/package/uuid

从 CakePHP 框架:

http://api.cakephp.org/class/string#method-Stringuuid(蛋糕 2.x) http://api13.cakephp.org/class/string#method-Stringuuid(蛋糕 1.3)

最后一个生成器选项:

考虑使用具有版本控制标志和相关选项的 Linux 命令行uuid程序,-v并使用它来提供数据库。这有点低效,但至少您不必编写自己的生成器函数。

http://linux.die.net/man/1/uuid - 手册页

uuidDebian 软件包)

我注意到对于命名空间版本,您将生成大量“长人名”以转换为 uuid。只要你和那些没有冲突,它可能会很甜蜜。例如,使用电子邮件地址注册的用户...获取该电子邮件地址的 v5 uuid...您总能找到那个人!似乎每次都吐出相同的 UUID,而 UUID 将代表 bob@bob.com 作为成员与 example.com 的唯一关系。

uuid -v5 ns:URL "http://example.com/member/bob@bob.com/"

评论:

此外,UUID,你似乎存储它们的方式,是 CHAR(36)?您可能会后悔,一旦比较运算符起作用。

Postgres 会将 UUID 视为 128 位值(并且可能会进行优化的二进制操作),而 MYSQL 的 CHAR(36) 解决方案正在查看 36 字节 = 288 位 ANSI 或 576 位 UTF8 加或减位/字节用于办公室-保持(并且可能会执行更慢的多字节字符逐多字节字符字符串例程)。

实际上,我已经对 MySQL 和 UUID 的问题进行了很多考虑……我的结论是,您需要编写一个存储函数,将十六进制表示形式转换为二进制表示形式进行存储,这将使所有“选择”语句都需要转换回十六进制表示......谁知道其中的效率会有多......所以最后只需要切换到 Postgres。XD

如果您确实想切换到 Postgres,如果它们是生产服务器,请在现有服务器上安装它时要非常小心。如...在实际进行迁移之前进行克隆以测试迁移过程。我以某种方式设法杀死了我的系统,因为“安装此软件包将删除大量重要的其他软件包”(我不知道安装程序是如何做出这些决定的)。

或者,如果您准备最终向他们支付大量资金来操作数据库,则可以使用 Microsoft SQL 获得他们的 GUID 等价物......

目前做 UUID 和 MySQL 只是一个坏主意。

于 2012-06-06T16:37:45.700 回答