我正在尝试解析网站的 HTML,比如 CNN.com,但每次我使用 WebBrowser 对象导航时,我的对象都会得到一堆空值。我没有使用 HTML 敏捷包。每当我调用 Navigate 方法时,mywebBrowser 都包含 null 和空白值。如何让 tagCollection 填充?我尝试执行 webClient.DownloadString 只是为了获取 HTML 页面的所有内容,但我不能使用它,因为我需要找到所有标签并且手动执行非常麻烦。我也不能使用 HTML Agility Pack。
using (WebClient webClient = new WebClient())
{
webClient.Encoding = Encoding.UTF8;
HtmlString = webClient.DownloadString(textBox1.Text);
}
WebBrowser mywebBrowser = new WebBrowser();
Uri address = new Uri("http://www.cnn.com/");
mywebBrowser.Navigate(address);
//HtmlString does contain all the HTML from Page
mywebBrowser.DocumentText = HtmlString;
//DocumentText only has "<HTML></HTML> after assignment
HtmlDocument doc = mywebBrowser.Document;
HtmlElementCollection tagCollection;
tagCollection = doc.GetElementsByTagName("<div");