0

我有这个网址 www.vipme.com/clothing_c900027 的HtmlDocument 因为他们的网站包含编码字符网站包括特别喜欢:// ,这里是我的代码

    Dim myHtmlDom As HtmlDocument = GetHtmlDocument(requestUrl, item.cookie, "refer", item.pageEncoding)
    Dim myProdDom As HtmlNodeCollection = myHtmlDom.DocumentNode.SelectNodes(item.prodPath)
    For Each inode As HtmlNode In myProdDom
        Dim newProd As New Product()    
        If (String.IsNullOrEmpty(item.urlPath)) Then
             newProd.Url = inode.GetAttributeValue(item.urlAttri, "").Trim()
        Else
            newProd.Url = inode.SelectSingleNode(item.urlPath).GetAttributeValue(item.urlAttri, "").Trim
            newProd.Url = Web.HttpUtility.UrlDecode(inode.SelectSingleNode(item.urlPath).GetAttributeValue(item.urlAttri, "").Trim)
        End If

调试时似乎不起作用 在此处输入图像描述

4

1 回答 1

0

最后我将 UrlDecode 更改为 htmldecode 方法:

    decodeStr = inode.SelectSingleNode(item.urlPath).GetAttributeValue(item.urlAttri, "")
    newProd.Url = Web.HttpUtility.HtmlDecode(decodeStr).Trim()

它运作良好

于 2016-04-01T04:26:11.370 回答