17

我刚开始尝试 C# WebClient。我所拥有的是下面的代码,它从网站获取 html 代码并将其写入 .txt 文件。我唯一的问题是某些网站要求您在使用该网站之前接受 cookie。这导致不是将真正的网站 html 代码写入 .txt 文件,而是写入 cookie 弹出 html 代码。

代码:

string downloadedString;
System.Net.WebClient client;

client = new System.Net.WebClient();
 
//"http://nl.wikipedia.org/wiki/Lijst_van_spelers_van_het_Nederlands_voetbalelftal"
downloadedString = client.DownloadString(textBox1.Text);

using (StreamWriter write = new StreamWriter("Data.txt"))
{
    write.Write(downloadedString);
}

那么解决这个问题的方法是什么?有人可以指导我走向正确的道路吗?

4

3 回答 3

29

用法 :

        CookieContainer cookieJar = new CookieContainer();
        cookieJar.Add(new Cookie("my_cookie", "cookie_value", "/", "mysite"));

        CookieAwareWebClient client = new CookieAwareWebClient(cookieJar);

        string response = client.DownloadString("http://example.com/response_with_cookie_only.php");

public class CookieAwareWebClient : WebClient
{
    public CookieContainer CookieContainer { get; set; }
    public Uri Uri { get; set; }

    public CookieAwareWebClient()
        : this(new CookieContainer())
    {
    }

    public CookieAwareWebClient(CookieContainer cookies)
    {
        this.CookieContainer = cookies;
    }

    protected override WebRequest GetWebRequest(Uri address)
    {
        WebRequest request = base.GetWebRequest(address);
        if (request is HttpWebRequest)
        {
            (request as HttpWebRequest).CookieContainer = this.CookieContainer;
        }
        HttpWebRequest httpRequest = (HttpWebRequest)request;
        httpRequest.AutomaticDecompression = DecompressionMethods.GZip | DecompressionMethods.Deflate;
        return httpRequest;
    }

    protected override WebResponse GetWebResponse(WebRequest request)
    {
        WebResponse response = base.GetWebResponse(request);
        String setCookieHeader = response.Headers[HttpResponseHeader.SetCookie];

        //do something if needed to parse out the cookie.
        if (setCookieHeader != null)
        {
            Cookie cookie = new Cookie(); //create cookie
            this.CookieContainer.SetCookies(request.RequestUri, setCookieHeader);
        }
        
        return response;
    }
}

您将看到 GetWebRequest 和 GetWebResponse 的两个重写方法。可以重写这些方法来处理 cookie 容器。

于 2013-01-27T19:41:18.403 回答
5

只需将标头中的 cookie 字符串存储到本地会话 _cookies 字符串中

if (System.Web.HttpContext.Current.Session["cookie"] != null)
            _cookies = System.Web.HttpContext.Current.Session["cookie"].ToString(); 

     using (WebClient wc =  new WebClient())
        {

            wc.Headers.Add("Cookie", _cookies);
             string HtmlResult = wc.UploadString(bridge_url, myParameters);
            _cookies = wc.ResponseHeaders["Set-Cookie"];
            Debug.WriteLine("Headers" + _cookies); 

            System.Web.HttpContext.Current.Session["cookie"] = _cookies;

        } 
于 2014-09-25T09:51:11.133 回答
3

这可能与如何让 WebClient 使用 Cookie?

我上面提到的问题是针对 VB.NET,但对于 C#,机制应该是相同的。我怀疑您看到的行为是网站正在发送 cookie,然后请求返回,但您的客户端未设置为将 cookie 返回到服务器,因此它将其解释为您“不接受 cookie”。

您是否使用过 Fiddler 之类的分析工具来分析与客户交流的内容?

您可能还必须发送一个特定的 HTTP 标头来表明您接受 cookie,但我不记得在我过去的经验中这是必需的。

于 2013-01-27T19:40:41.587 回答