我有兴趣了解为什么如此多的服务(如 Twitter 和 Facebook)以他们的方式命名他们的 CDN 文件。看着http://25.media.tumblr.com/tumblr_m6m6g57NgY1qdhfhho2_1280.jpg我有一些观察性问题:
- 他们是否使用多个子域(25.media、26.media 等)从单个域卸载 DNS 查询?看起来 storage.tumblr.com 对他们所有的图片来说已经足够了,因为 S3 只是有一个大桶的概念。
- 他们是否在文件名中插入了一个散列字符串以防止从网络收集工具中连续遍历?这似乎是个好主意。获取文件名并在其上附加一些垃圾,对其进行哈希处理,然后将该哈希插入到 tumblr_XXXXXXXXXXXXXXXXXX_1280.jpg 文件名中。