2

我有从网站获取响应的简单代码,但有一个小问题。我正在尝试从俄罗斯网站和一个网站获得未知符号的响应,而从另一个网站获得正常文本。哪里可能有问题?

来自:www.kinopoisk.ru 的回复

������ �����...

回复来自:www.yandex.ru

Греция - Чехия。1:2...

    HttpWebRequest http = (HttpWebRequest) HttpWebRequest.Create("http://");
    http.Timeout = 30000;
    http.KeepAlive = true;
    http.ContentType = "application/x-www-form-urlencoded";
    http.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20100101 Firefox/12.0";
    http.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
    http.Proxy = null;

    WebResponse response = http.GetResponse();
    Stream istream = response.GetResponseStream();
    StreamReader reader = new StreamReader(istream);

    Response.Write(reader.ReadToEnd());

    reader.Close();
4

2 回答 2

7

kinopoisk.ru被编码为WINDOWS-1251 (您可以在Content-Type标题中看到这一点)。

您需要传递Encoding.GetEncoding(1251)给 StreamReader 以对其进行解码。

于 2012-06-12T19:17:16.527 回答
1

这是一个字符集问题。如果要获取请求响应的字符集,HttpWebResponse 类为我们提供了一个名为 CharacterSet 的属性。此属性返回字符串类型值。

myWebRequest = (HttpWebRequest)HttpWebRequest.Create(url);
myWebRequest.Method = "GET";
myWebResponse = (HttpWebResponse)myWebRequest.GetResponse();
string str = myWebResponse.CharacterSet;

如果您想知道使用哪种编码方法对响应进行编码,为此我们有一个名为 ContentEncoding 的 HttpWebRequest 类的属性。此属性返回字符串值。

myWebRequest = (HttpWebRequest)HttpWebRequest.Create(url);
myWebRequest.Method = "GET";
myWebResponse = (HttpWebResponse)myWebRequest.GetResponse();
string str = myWebResponse.ContentEncoding;
于 2012-06-12T19:26:35.757 回答