我正在使用 Hpple 传递 HTML 文件。HTML 文件与以下内容非常相似。
<div class="entry">
<p>some text here
<a>Inside a</a>
another text here
</p>
<div class="caption">
caption here
</div>
<p>Blah
</p>
</div>
我想看到的结果是“这里有一些文本,这里有另一个文本 Blah”(忽略所有内容是标题 div 并包括内部和之后的内容)
以下是我尝试过的一些查询:
"//div[@class='entry']/p"
结果:"some text here"
"//div[@class='entry']//p"
结果:"some text here caption here Blah"
"//div[@class='entry']/p//text()"
结果:Nothing
谢谢。