1

我正在编写代码,试图从在线 DNS 报告 ( http://viewdns.info/dnsreport/?domain=google.com ) 中获取 HTML,但我遇到了一些问题。我真正需要的 HTML 文件中的一行(第 231 行)是在大约 680 个字符后自行切断。但是,重要的行之后的所有行都正确读取。抓取 HTML 的代码如下所示,我尝试了两种不同的方式。这是我尝试的第一种方法:

Public Function getWebResourceData(ByVal strURL As String) As String
    Dim webClient As New System.Net.WebClient
    Dim result As String = webClient.DownloadString("http://viewdns.info/dnsreport/?" &        TextBox1.Text)
    return result
End Function

这是第二个:

Public Function getWebResourceData(ByVal strURL As String) As String
    Dim rt As String = ""
    Dim wRequest As WebRequest
    Dim wResponse As WebResponse
    Dim SR As StreamReader
    wRequest = WebRequest.Create(strURL)
    wResponse = wRequest.GetResponse
    SR = New StreamReader(wResponse.GetResponseStream)
    rt = SR.ReadToEnd
    SR.Close()
    return rt
End Function

我真的不确定此时还有什么问题。我也尝试将结果保存到文本文件中,看看是否是问题所在,但这也是不正确的。我已经查看了字符串停止区域的十六进制代码,但没有任何异常。拆分发生在背靠背鳄鱼括号(显示为括号)之间:(/tr)(tr)

但是在整个 HTML 中有很多这样的标签集,它们没有问题。

4

1 回答 1

0

你的两个函数都不会返回他们读过的内容。我已经测试了第二个,它工作正常。

Sub Main
    Dim ret = getWebResourceData("http://viewdns.info/dnsreport/?domain=google.com")
    Console.WriteLine(ret.Length)
     ' Output = 21605
End Sub

Public Function getWebResourceData(ByVal strURL As String) As String
    Dim rt As String = ""
    Dim wRequest As WebRequest
    Dim wResponse As WebResponse
    Dim SR As StreamReader
    wRequest = WebRequest.Create(strURL)
    wResponse = wRequest.GetResponse
    SR = New StreamReader(wResponse.GetResponseStream)
    rt = SR.ReadToEnd
    SR.Close()
    return rt
End Function
于 2014-06-06T20:11:40.583 回答