我需要从 html 页面解析/提取信息。基本上我正在做的是使用 System.Net.WebClient 将页面加载为字符串,并使用 HTML Agility Pack 来获取 html 标记(表单、标签、输入等)内的内容。
但是,某些内容位于 javascript 脚本标记内,如下所示:
<script type="text/javascript">
//<![CDATA[
var itemCol = new Array();
itemCol[0] = {
pid: "01010101",
Desc: "Some desc",
avail: "Available",
price: "$10.00"
};
itemCol[1] = {
pid: "01010101",
Desc: "Some desc",
avail: "Available",
price: "$10.00"
};
//]]>
</script>
那么,如何将其解析为 .NET 中的集合?HTML Agility Pack 能帮上忙吗?我真的很感激任何帮助。
提前致谢。