1

我有一个包含这样的段落标签的 div

<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>
<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>

我需要使用htmlagiitypack获取所有段落文本的文本我试过这个,

Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
                    debug.print(item.InnerText)
                Next

我期望每个 div 字符串的输出是

First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph

但是我在返回的文本中得到了一些 html,有人可以帮我纠正这个问题吗

4

1 回答 1

3

您必须实际选择段落的内部文本。你的 xpath 得到了完全不同的东西。

Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")
于 2012-06-15T06:09:32.343 回答