1

我尝试使用 HTML Agility Pack 解析以下 HTML。

这是一段 HTML 代码:

<body id="station_page" class="">
...
<div>....</div>
<script type="text/javascript"> 
if (Blablabla == undefined) { var Blablabla = {}; }
Blablabla .Data1= "I want this data";
Blablabla .BlablablaData = 
{  "Data2":"I want this data",
"Blablabla":"",
"Blablabla":0   }
{   "Blablabla":123,
"Data3":"I want this data",
"Blablabla":123}
    Blablabla .Data4= I want this data;
</script>...

我正在尝试获取这 4 个数据变量(Data1、Data2、Data3、Data4)。首先,我试图找到javascript:

doc.DocumentNode.SelectSingleNode("//script[@type='text/javascript']").InnerHtml

如何检查它是否真的是正确的 javascript?找到相关的 javascript 后,如何获取这 4 个数据变量(Data1、Data2、Data3、Data4)?

4

1 回答 1

4

您无法使用 HTML Agility Pack 解析 javascript,它仅支持 HTML 解析。您可以使用这样的 XPATH 获取所需的脚本:

doc.DocumentNode.SelectSingleNode("//script[contains(text(), 'Blablabla')]").InnerHtml

但是您需要使用另一种方法(正则表达式、js 语法等)解析 javascript

于 2013-03-08T14:59:40.263 回答