我正在从服务器读取 .ASP 页面。我遇到的问题是,当我尝试通过下面的 C# 代码读取数据时,页面被截断。
下面是我访问 .asp 页面的代码
var htmlDocument = EmbeddedBrowser.Document as IHTMLDocument2;
var htmlInnerContent = (((HTMLDocument)(htmlDocument)).documentElement).innerHTML;
下面是位于我的服务器上的 .asp 页面
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head><script type="text/javascript">Lots of Java Script Here</script><script type="text/javascript">Lots more Java Script Here</script>
</head>
<body>
<input type="" name="ExpectedClientVersion" value="20.15.09"/>
</body>
</html>
下面是我读入后的htmlInnerContent的内容
<head>
<script type="text/javascript">Lots of Java Script Here</script
</head>
如您所见,我缺少真正需要的主体,因此我可以解析 ExpectedClientVersion。
我运行了一个提琴手跟踪,我可以看到整个文档都被传递了。
我还尝试研究 .InnerHTML 的局限性,但发现只缺少文档。这可能是有原因的。
我觉得我访问文档的方式可能不正确。有没有人对此有见识?