21

现在,这并不是严格意义上的 URL 缩短,但无论如何我的目的是这样的,所以让我们这样看待它。当然 URL 缩短的步骤是:

  1. 获取完整的 URL
  2. 生成唯一的短字符串作为 URL 的键
  3. 将 URL 和键存储在数据库中(键值存储将是完美的匹配)

现在,关于第二点。这是我想出的:

ByteArrayOutputStream baos = new ByteArrayOutputStream();
DataOutputStream dos = new DataOutputStream(baos);
UUID uuid = UUID.randomUUID();
dos.writeLong(uuid.getMostSignificantBits());
String encoded = new String(Base64.encodeBase64(baos.toByteArray()), "ISO-8859-1");
String shortUrlKey = StringUtils.left(encoded, 6); // returns the leftmost 6 characters
// check if exists in database, repeat until it does not

这够好吗?

4

2 回答 2

5

对于我编写的文件上传应用程序,我也需要这个功能。阅读了这篇 SO 文章后,我决定只使用一些随机数并检查它们是否存在于数据库中。

因此,您的方法与我所做的相似。

于 2011-01-01T14:10:19.163 回答
2

那么 URL 缩短是什么意思?

有非常不同的技术。大多数网站 AFAIK 使用该技术将数据库主键(可能以某种编码形式)放在 URL 中的某个位置,可以通过正则表达式对其进行解析,并使用关键字增强其余部分。

来自亚马逊的示例:http://www.amazon.de/Bauknecht-WA-PLUS-614-Waschmaschine/dp/B003V1JDU8/

您可以输入任何内容来代替产品名称,只有末尾的 id 很重要。

但是,您可能希望保持链接干净并检查它是否正确,并执行 301 转发到真实 URL 或在出现错误 URL 时放置规范 URL。

然而:

如果你想做类似TinyURL的事情,我的回答是肯定的。

这还不够好。

这要看情况。

这不是“安全的”。猜测 URL 非常容易。更好的方法是使用一些加密函数,如 SHA-1/MD5。

当涉及到碰撞时,我真的说不出来。GUID 设计为没有冲突,但您只使用前 6 个字符。我不知道它们在算法中到底代表什么。但这绝对不是最优的。

但是,为什么不只使用数据库自​​动递增主键?如果安全性很重要,您肯定也必须使用超过 6 个字符。

在我做的一个项目中,我使用了类似的东西

/database-primary-key/hash-of-primary-key-with-some-token-or-client-information/

通过这种方式,我可以直接在数据库中查找主键,这是最快的方法,但也可以验证该链接是否没有通过哈希强制的蛮力找到。在我的情况下,哈希是客户端的秘密令牌和主密钥的 SHA-1 总和。

于 2011-01-01T14:04:25.013 回答