2

这个问题与这个问题有关:Character encoding Microsoft.XmlHttp in Vbscript,但有一点不同,国家字符在域名中,而不仅仅是参数。

任务是:从给定的 URL 下载页面。

我已经解决了通过 ADO 从 UTF8 编码文件中读取 UTF8 字符串到 VBScript 的问题。

但是现在当我尝试打开它时,MSXML2.ServerXMLHTTP 返回错误: URL 无效。

这是VBScript代码:

Set objStream = CreateObject("ADODB.Stream")
objStream.CharSet = "utf-8"
objStream.Open
objStream.LoadFromFile("fileWithURL.txt")
url = objStream.ReadText()
objStream.Close

Set XMLHttpReq = CreateObject("MSXML2.ServerXMLHTTP")
XMLHttpReq.Open "GET", url, False
XMLHttpReq.send
WEBPAGE = XMLHttpReq.responseText

如果您将hxxp://россия.рф/main/page5.html之类的内容放入 UTF8 编码的 fileWithURL.txt 中,则脚本将在与hxxp://google.com正常工作时引发错误。

解决方法是使用域名的 ascii 表示 - 但我还没有找到用于 vbscript 的 PunnyCode 编码器(除了Chillkat,这对我的任务来说是一种过度杀伤力)。

感谢您对主要问题或解决方法的帮助。

4

1 回答 1

2

我在硬盘驱动器的深度进行了一次惊人的旅程,并找到了由 / 为Jesper Høy 编写的代码。这是当时 SimpleDNS Plus 的 IDN 转换工具的源代码。

Archive.org 页面快照:http
://www.simpledns.com/idn-convert.asp Archive.org 文件快照:idn-convert-asp.zip

您也可以从此gist复制整个代码。

创建一个函数来转换 URL。

Function DummyPuny(ByVal url)
    Dim rSegments : rSegments = Split(url, "/")

    If UBound(rSegments) > 1 Then
        rSegments(2) = DomainPunyEncode(rSegments(2))
    End If

    DummyPuny = Join(rSegments, "/")
End Function

然后在发出请求之前转换您的网址。

XMLHttpReq.Open "GET", DummyPuny(url), False
于 2016-08-26T12:24:17.097 回答