0

有没有想过为什么 Google 有这么长的 URL?我认为这是因为他们从该 URL 的变量中获得了许多信息。例如,我把来自 Chrome 徽标的代码(来自当网页不存在时出现在 Chrome 浏览器上的网页。谷歌从这种长 URL 中收集什么样的信息?如果我们讨论长网址,当您在 Google.com 上搜索某些内容时,您是否注意到过长网址?它们从网址中收集大量信息。您知道 Google 长网址中的任何这些信息吗?

#logo-img {
/* "Not allowed to load local resource: chrome://theme/IDR_PRODUCT_LOGO",
so embed the resource manually. */
content: -webkit-image-set(

url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAKsAAAAgCAYAAABtn4gCAAAI9klEQVR4Xu2cfYxcVRmHn3Pu3Nm6lXa2ta0AYlsgFSGgThMU0W5hGkqApNGARk3cGm3BRN3FYGuCISrBXaNphcSkG2I3hn9gY2gSNWq32AoE1C6KRihFti2QSgvsTmm783HvOa+zM69cSS8Tacsq7n2SX87cj5P7ZvLs2ztnbseICG8HMjIsbxMyMnIoxhja8fJnriuYMNdjOsIVNhd0Y0wBRbxH6nHZ16OdUot2iXNDC3/2mzJtOImOnpHJ2p4Xr13ZkDTYJLHrwRgwPJggg==') 2x);
}
4

3 回答 3

0

那是一个base64编码的图像。这只是 chrome 徽标本身的数据。Web 开发人员有时会以这种方式嵌入图像作为一种优化技术。它的优点是为您节省了一个 HTTP 请求。(HTTP 标头并非无足轻重,尤其是对于获得与 google 一样多的流量的网站。)不幸的是,您无法缓存嵌入的图像,所以就是这样。

至于长搜索 URL 的含义,这里解释了大多数/所有这些名称值对。

长 URL 是允许某人将结果链接复制/粘贴给其他人并让他们看到相同内容的特定决定。如果他们只是将搜索查询作为 URL 参数包含在内,并将其他所有内容存储在 POST 中,那么每个点击链接的人的本地化搜索结果都会有所不同。

于 2013-02-12T16:42:18.730 回答
0

URL 由路径和参数组成:path?param1=value1&param2=value2

此外,URL 必须采用可接受的编码,因此,为了将某些字符(UTF-8、二进制等)放入参数值,将数据转换为 base64(变体)或十六进制的情况并不少见。问题中提供的 URL 中的数据显示了以某种类似方案编码的内容(注意“base64”编码符号),并且可能表示加密的二进制内容。如果处理得当,这允许生成器使用他们自己的(通用)加密密钥发送“块”数据,并且当与 PKI 技术一起使用时,可以确保内容在传输过程中没有被修改。然后只能由发起者在任何时候重新读取。因此,要回答这个问题,这看起来像是加密的内容。如果使用 AES-256 或其他常见(强)加密,尝试破译是不切实际的。通常,尝试简单地对内容进行 base-64 解码(反向)以查看原始内容。如果它是人类可读的,则其下面可能是 ASCII、latin-1 或 UTF-8 内容。如果解码后的字符无法破译,则可能是加密的,因此(似乎)不可读。

于 2013-02-12T16:47:52.100 回答
0

那不是收集任何信息。它只是提供用于显示的图像。

长文本只是一个 base64 编码的字符串,其中包含将从文件加载的二进制信息。如果您对其进行解码,您会看到它以 PNG 标头开头,这就是 'image/png' 所说的应该包含的内容。

基本上,Chrome 已经在脚本中嵌入了 PNG 图像的全部内容,而不是将文件存储在某个地方。该评论甚至告诉您原因 - “不允许加载本地资源:chrome://theme/IDR_PRODUCT_LOGO”。

URL 不必通过网络访问信息。以“http:”或“ftp:”开头的 URL 可以。那些以'file:'开头的访问本地文件。那些以“数据:”开头的数据本身存储在 URL 中。

于 2013-02-12T16:53:34.830 回答