我正在尝试从已在 IE 中打开的 wabpage 获取 XML 文本。由于目标页面的安全性(带有证书等的冗长无聊的故事),不允许 Web 请求。我使用方法遍历所有打开的页面,如果发现与页面的 URI 匹配,我需要获取它的 XML。前段时间我需要在body标签之间获取一个HTML代码。我对IHTMLDocument2使用了这样的方法:
private string GetSourceHTML()
{
Regex reg = new Regex(patternURL);
Match match;
string result;
foreach (SHDocVw.InternetExplorer ie in shellWindows)
{
match = reg.Match(ie.LocationURL.ToString());
if (!string.IsNullOrEmpty(match.Value))
{
mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
result = doc.body.innerHTML.ToString();
return result;
}
}
result = string.Empty;
return result;
}
所以现在我需要获取目标页面的完整 XML 代码。我用谷歌搜索了很多,但没有发现任何有用的东西。有任何想法吗?谢谢。