0

我们的网站刚刚推出了一个新版本,现在页面的 url 中有 Unicode。我看到 Rails 在渲染锚标签时正确地转义了这些 UTF-8 字符。

/regions/%E4%B8%AD%E5%BD%B0%E6%8A%95/

但是,我仍然看到大量带有错误编码网址的流量:

/regions/%A4%A4%B9%FC%A7%EB/

显然这是同一个地址,但以非 UTF-8 编码,然后 url 转义。

问题

我想知道是否有任何旧浏览器,它将正确转义 url,将其取消转义以获取 UTF-8,将其编码为其他编码,然后在请求服务器时对其进行 url-escape?

否则我不知道如何解释这些流量。

4

1 回答 1

0

我在 Internet Explorer 6 和 7 中进行了测试。我还测试了“始终以 UTF-8 形式发送 URL”选项。没有一个组合导致不正确的编码请求。

我猜这是一些处理解码但不编码的网络爬虫。

于 2012-12-04T08:33:43.193 回答