18

我收到一位客户的请求,他希望能够在 IE10 地址栏中输入带有参数的我的 Web 服务的查询字符串并获取服务结果。参数包括希伯来语中的字符串,例如:

http://mywebsite.com/service.asmx/foo?param1=123&param2=מחרוזתבעברית

在我看来,IE10 不会对查询字符串参数进行编码——在 ? 之后的每个非 ASCII 字符。标记将转换为“3f”字节,尽管它确实对 ? 之前的内容进行了编码。标记 - 网址本身。

例如,如果我尝试访问 url(参数是虚构的,url 不是,并且我与该站点没有任何联系)

http://www.shlomo.co.il/pageshe/sales/רכב-למכירה.asp?param=פאראם 

并在wireshark中查看我发送到服务器的字节,它显示了我

线鲨输出

您可以看到它确实将 URL 的希伯来语部分替换为 urlencoded 字符串,但将希伯来语参数替换为 ?????,即 '3f'。

chrome 中的相同字符串将被完整编码:

GET http://www.shlomo.co.il/pageshe/sales/%D7%A8%D7%9B%D7%91-%D7%9C%D7%9E%D7%9B%D7%99%D7%A8%D7%94.asp?param=%D7%A4%D7%90%D7%A8%D7%90%D7%9D HTTP/1.1

我在装有win7/IE10和winXPheb/IE8的机器上试过。

我的 IE 设置是(特别是检查了“始终显示编码地址选项”以查看它是否有帮助并重新启动,但没有任何区别):

在此处输入图像描述

我试图四处搜索有关该问题的任何信息,但没有找到太多信息。

我的问题是:

  • 确实是这样,还是我错过了什么?
  • 这种行为是否记录在任何地方?
  • IE/Win 中是否有任何启用参数编码的设置。

ps 当然,如果我正在开发客户端/Web ui,我会简单地对我的查询进行 urlencode,但我来自客户的请求正是将查询粘贴到 IE 地址栏,这就是我对这种特定行为感兴趣的原因。

谢谢。

4

3 回答 3

19

是的,您对行为的观察是准确的。Internet Explorer 10 及以下版本遵循复杂的算法来对 URL 进行编码。据称这是在 Internet Explorer 11 中更新的,但我发现新选项似乎不起作用

“始终显示编码地址选项”涉及是否为 IDN 主机名显示 PunyCode,并且不影响查询字符串。Send UTF-8 URLs主要适用于路径的编码,尽管它也会影响其他代码路径

该行为在任何地方都没有完整记录。我本来打算在我的 IEInternals 博客上写一篇关于它的完整文章,但最终在这样做之前离开了微软。这篇博文中有部分解释。

是的,有些设置会影响行为。工具 > Internet 选项 > 高级中的Send UTF-8 URLs复选框是确定如何发送 URL 的变量之一,但该选项不会盲目地执行它所暗示的事情(它仅 UTF-8 编码路径,而不是查询字符串)。其他涉及的变量包括:

  1. 输入 URL 的位置(例如地址栏与开始 > 运行等)
  2. 系统的 ANSI 代码页是什么(例如操作系统默认使用的语言环境)
  3. 浏览器中当前加载页面的字符集

由于这些变量,您无法在 Internet Explorer 中可靠地使用未正确编码的 URL(例如 %-转义 UTF8)。

于 2013-08-13T22:13:43.923 回答
5

不幸的是,对于 Internet Explorer 11(内部版本 11.0.9600.17358,win7-x64)仍然如此

我看到你不能不幸地改变网络服务器。然而,那些正在开发新服务的人可能会考虑将请求参数更改为路径变量,例如从http://myserver.com/page ?τεστ 到http://myserver.com /τεστ/

于 2014-11-14T15:01:11.370 回答
3

如果客户端从 javascript 调用 web-service, encodeuricomponent可以使用。在你的情况下encodeuricomponent("מחרוזתבעברית");

http://www.w3schools.com/jsref/jsref_encodeURIComponent.asp

于 2015-09-03T09:53:45.707 回答