我正在使用以下代码下载给定的网页。
using (WebClient client = new WebClient())
{
client.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
using (Stream data = client.OpenRead("https://www.yellowpages.com/south-jordan-ut/plumbers?page=5"))
using (StreamReader reader = new StreamReader(data))
{
string html = reader.ReadToEnd();
}
}
它有效,但html
似乎只包含最后一页的一小部分。我知道这个网站有动态内容,但是当我在 Chrome 中查看源代码时(通过选择查看页面源命令),它似乎下载了所有内容。
除非 Chrome 在您运行View page source时实际运行脚本,否则它似乎正在使用其他技巧来获取所有 HTML。有谁知道这个技巧可能是什么?