我有一些包含特殊字符的 URL。例如:
http://www.example.com/bléèàû.html
如果您在浏览器中键入此 URL,我的 Web 服务器将显示正确的页面(它可以处理特殊字符)。
我查看了站点地图规范,不清楚站点地图文件是否可以包含特殊字符。根据我对协议的理解,如果 URL 工作正常并且服务器提供正确的页面并且 XML 文件是 UTF-8 编码的,那么就可以了。
例如,此条目是有效的站点地图条目:
<url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>
任何人都可以证实这一点?
[更新] 我不愿意对特殊字符进行编码的原因是我不想为相同的内容引入重复的 URL。例如
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html
和
http://www.example.com/bléèàû.html
将提供相同的页面。我认为 Google 会通过其正常索引和站点地图同时捕获 URL。不幸的是,谷歌倾向于降低具有指向同一页面的重复 URL 的网站的页面排名。