0

以下是 HTML:

    <div class="CatContent">
<div class="LeftCon">
<span class="mv"></span>
<a href="http://movies.justdial.com/movies/Mumbai.html" target="_blank" onclick="_ct("psc_Movies","hmpg");">
<p>
</div>
<div class="RightCon">
</div>

我想提取h1标签之间的文本,即Movies.

h1用于提取标签之间文本的 XPath 应该是什么??

这就是我正在尝试的:

Dim webGet = New HtmlWeb()
        Dim document = webGet.Load("http://www.asadsdsad.com/")
        Dim nodes = document.DocumentNode.SelectNodes("//*[@class='LeftCon']/a[@target='_blank']/h1")

        Dim _table As New Data.DataTable

        _table.Columns.Add("BusinessPIN", GetType(String))
        For i = 0 To nodes.Count - 1
            Dim _newRow As Data.DataRow = _table.NewRow
            _table.Rows.Add(nodes(i).InnerText)
        Next
        GridView1.DataSource = _table
        GridView1.DataBind()
        MsgBox(GridView1.Rows.Count)

我尝试了许多变体,但总是得到 “System.NullReferenceException:对象引用未设置为对象的实例”。

4

1 回答 1

1

用于提取 h1 标记之间的文本的 XPath 应该是什么??

//h1这将为您提供所有 h1 元素

迭代 h1 htmlelements 的集合,然后使用 HtmlElement 的 InnerText 属性获取文本

于 2012-08-05T15:22:33.423 回答