在这里假设所讨论的语言是英语,并且使用的字符集是基本的 ASCII / 拉丁字母。
生成“短 URL”时,首先想到的往往是使用大型“代码集”/字母表将整数(可能是引用数据库中长 URL 的 ID)转换为高“基数”(URL-friendly Base- 64,例如)。在我的具体情况下,我首先选择规范化为 Base-36(数字、拉丁字母,不区分大小写)。
然而,经过仔细检查,人们可能会发现他们的短 URL 生成器最终会吐出顽皮的词或其他常见词,这可能是非常不受欢迎的。
避免生成“真实单词”的一种选择是去掉所有常见的元音。
是否有其他/更好的解决方法不会牺牲太多的净空?