6

蜘蛛是否会将以下 2 个规范链接标签视为指向同一个 URL?

<link rel="canonical" href="http://www.example.com/&#375;" />-编码
<link rel="canonical" href="http://www.example.com/ŷ" />-未编码

4

4 回答 4

3

&#375;是一个 HTML 实体,它以十进制表示法表示带有代码点 375 的 Unicode 字符。在十六进制中它是 0x177 所以我们谈论的是 U+0177 是ŷ.

这意味着两个 URL 完全相同,如果:

  1. 它们显示在 HTML 文档的上下文中。
  2. 该文档声明了一个支持此类符号的正确字符集,并且您用来键入它的编辑器插入了正确的代码。

如果浏览器在这两种情况下都显示 ŷ,则字符集可能是正确的,但您应该确保它是正确的。

于 2010-11-24T11:33:37.173 回答
2

如果您以 UTF-8 格式传达您的 HTML,则 url 被视为相同。

于 2010-11-24T11:19:27.637 回答
1

不是 100% 肯定,但我认为它们都会指向同一个 URL。但请记住,在查看 W3 标准时,他们经常建议对链接进行编码。

于 2010-11-24T11:18:14.657 回答
1

即使您可以期望它在现代浏览器中工作,http://www.example.com/ŷ 也是一个无效的 URL

您应该始终对 unicode 字符进行百分比编码。

于 2010-11-24T11:25:01.583 回答