0

嘿,我开始同时学习 C# 和 HtmlAgilityPack,到目前为止,我正在做一个小测试项目。我遇到的一个问题是检查文件是否已经存在,以便不下载两次。

另一个问题是,在抓取网站/下载图像时,我的整个程序会冻结一段时间,然后才能再次运行,有没有办法解决这个问题?

if (!File.Exists(@"Res\" + pokeName + ".jpg"))
        {
            var item = doc.DocumentNode.SelectNodes("//a[@class='image']//img")[0];
            if (doc.DocumentNode.SelectNodes("//a[@class='image']//img") != null)
            {
                getImage(item.GetAttributeValue("src", ""));
                pictureBox1.Load(@"Res\" + pokeName + ".jpg");
            }
        }
        else
        {
            pictureBox1.Load(@"Res\" + pokeName + ".jpg");
        }

公共无效getImage(字符串网址){

        string imageUrl = @""+ url;
        string saveLocation = @"Res\"+ pokeName + ".jpg";

        byte[] imageBytes;
        HttpWebRequest imageRequest = (HttpWebRequest)WebRequest.Create(imageUrl);
        WebResponse imageResponse = imageRequest.GetResponse();

        Stream responseStream = imageResponse.GetResponseStream();

        using (BinaryReader br = new BinaryReader(responseStream ))
        {
            imageBytes = br.ReadBytes(500000);
            br.Close();
        }
        responseStream.Close();
        imageResponse.Close();

        FileStream fs = new FileStream(saveLocation, FileMode.Create);
        BinaryWriter bw = new BinaryWriter(fs);
        try
        {
            bw.Write(imageBytes);
        }
        finally
        {
            fs.Close();
            bw.Close();
        }
    }

任何帮助将不胜感激 :)

4

1 回答 1

0

您的程序可能会冻结,因为您在 UI 线程上有长时间运行的项目。

您可能希望查看使用前面提到的后台工作程序,或者(如果您使用的是 .Net 4.5)新的异步/等待系统

GetStreamAsync 非常适合这种情况,当您有潜在的长时间等待或大量项目要使用而不是迭代地获取它们时 http://msdn.microsoft.com/en-gb/library/vstudio/hh551738.aspx

另外作为旁注,如果我有 3 张图片 {1.jpg, 2.jpg, foo/1.jpg} 你输入的代码你不会得到第三张,因为名称与第一张图片匹配,还有很多比 jpeg/jpg 更多的图像扩展 :)

于 2013-03-24T02:10:29.533 回答