0

我正在处理的网站希望生成自己的缩短 URL,而不是依赖于 tinyurl 或 bit.ly 等第三方。

显然,我可以在将新 URL 添加到站点时对它们进行计数,并使用它来生成短 URL。但如果可能的话,我会尽量避免这种情况,因为要让这件事发挥作用似乎需要做很多工作。

由于需要短 URL 的东西都是网络服务器上的真实物理文件,因此我当前的解决方案是使用它们的 inode 编号,因为这些编号已经生成供我使用并保证是唯一的。

function short_name($file) {
   $ino = @fileinode($file);
   $s = base_convert($ino, 10, 36);
   return $s;
}

这似乎有效。问题是,我该怎么做才能使短 URL 更短?

在使用它的系统上,新添加文件的 inode 位于使上述函数返回 7 个字符长的字符串的范围内。

我可以安全地丢弃一些(一半?)inode 的位吗?如果是这样,它应该是高位还是低位?

我想过使用文件名的 crc32,但这实际上使我的短名称比使用 inode 更长。

这样的事情会有碰撞的风险吗?通过选择“$referencefile”的正确值,我已经能够降低到个位数。

function short_name($file) {
   $ino = @fileinode($file);
   // arbitrarily selected pre-existing file,
   // as all newer files will have higher inodes
   $ino = $ino - @fileinode($referencefile);
   $s = base_convert($ino, 10, 36);
   return $s;
}
4

3 回答 3

13

不确定这是一个好主意:如果您必须更改服务器,或更改磁盘/重新格式化它,您文件的 inode 编号很可能会改变......并且您所有的短 URL 都将被破坏/丢失!

如果出于任何原因需要将文件移动到磁盘的另一个分区,顺便说一句,同样的事情。


另一个想法可能是像你建议的那样计算文件名的一些 crc/md5/whatever,并使用一些算法来“缩短”它。

这里有几篇关于此的文章:

于 2009-08-24T17:07:22.877 回答
2

相当巧妙地使用了那里的文件系统。如果您保证 inode id 是唯一的,那么它是一种生成唯一编号的快速方法。我想知道这是否可以在 NFS 上始终如一地工作,因为显然不同的机器会有不同的 inode 编号。然后,您只需序列化您在那里创建的文件中的链接信息。

为了稍微缩短 url,您可能会考虑区分大小写,并执行一种安全编码(您会从中得到大约 base62 - 10 [0-9] + 26 (az) + 26 (AZ),或者如果你删除一些“冲突”字母,比如Ivs lvs ,或者更少1……那里有很多例子/库)。

正如您所说,您还想用偏移量“归位”您的 ID。您还需要弄清楚如何防止临时文件/日志文件等创建占用您的密钥空间。

于 2009-08-24T17:17:40.983 回答
0

查看Sean Inman 的Lessn;还没有玩过它,但它是一个自托管的滚动您自己的 URL 解决方案。

于 2009-08-24T17:14:31.037 回答