0

我正在使用 Hpple 传递 HTML 文件。HTML 文件与以下内容非常相似。

    <div class="entry">
        <p>some text here
        <a>Inside a</a>
         another text here
        </p>
       <div class="caption">
        caption here
       </div>
        <p>Blah
        </p>
    </div>

我想看到的结果是“这里有一些文本,这里有另一个文本 Blah”(忽略所有内容是标题 div 并包括内部和之后的内容)

以下是我尝试过的一些查询:

  1. "//div[@class='entry']/p" 结果:"some text here"
  2. "//div[@class='entry']//p" 结果:"some text here caption here Blah"
  3. "//div[@class='entry']/p//text()" 结果:Nothing

谢谢。

4

2 回答 2

0

尝试这个:

//div[@class='entry']//p//text() - should return "Some text here another text here Blah" 
//div[@class='entry']//text() - should return "Some text here another text here caption here Blah" 
于 2013-04-29T12:54:30.463 回答
0

您可能自己已经回答了这个问题,但我也遇到了类似的问题。获取我使用的文本

//div[@class='entry']//a[@inside]//*

这让我得到了你所说的里面的文本。让我知道这个是否奏效。我自己还在学习解析 HTML。祝你好运。

于 2013-04-25T12:56:40.327 回答