0

我有这段代码,我不知道为什么它没有打印出下一个容器的内容。

     HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
     doc.Load("Billing106.htm");

     foreach (HtmlNode div in doc.DocumentNode.SelectNodes("//div[starts-with(., ' SEMANTIC:')]"))
     {
        richTextBox1.Text += "SC: " + div.NextSibling.InnerText.ToString();
     }

我在 HTML 文件中有几个条目,如下所示:

    <div style="top: 232px; left: 332px;" class="S4"> SEMANTIC:</div>
    <div style="top: 233px; left: 377px;" class="S3"> SBR02 specifies the relationship to the person insured.</div>

我无法检查 class="S3" 因为有多个项目使用同一个类。

如果有人知道如何使它工作,将不胜感激,因为我想回家享受我的周末,我一定会送你一个电子啤酒,呵呵。

注意:它会打印 3 次“SC:”它在文档中出现 3 次。

4

1 回答 1

1

这是因为这个 DIV 元素的下一个兄弟元素不是另一个 DIV,而是两个 DIV 之间的文本(是的,它们也是节点)。如果你想要 DIV 类型的下一个兄弟,你应该这样做:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
     doc.Load("Billing106.htm");

 foreach (HtmlNode div in doc.DocumentNode.SelectNodes("//div[starts-with(., ' SEMANTIC:')]"))
 {
    richTextBox1.Text += "SC: " + div.SelectSingleNode("following-sibling::div").InnerText.ToString();
 }

有关 XPATH 轴的说明,请参见此处:XPATH Axes

于 2013-04-20T06:26:24.903 回答