所以我认为这是我最后一个 Hpple 问题!我在使用 Hpple 解析的 HTML 文档中找到了一个条目。我尝试了许多不同的查询,但没有运气。这是 HTML 的示例。
我可以使用 //div[@class = 'entry-content']/p 获取以“Today's project”开头的文本。我还可以使用 //div[@class = 'entry-content']//a[@title]//* 以及它之后的所有文本来获取下一个标签。但是,如您所见,“/span”之后仍有一些文本。但是,我尝试过的任何方法都行不通。我试过查看元素的子元素,试过 //div[@class = 'entry-content']/p//text(), //div[@class = 'entry-content']/p//以下::*,没有任何效果。如果有人有任何想法,我全神贯注!!!再次感谢您的所有时间。
编辑#1 当我尝试不同的东西时,我正在查看 HTML。p 标签下是我需要的文本,“今天的项目......”然后有一个跨度更改文本颜色并包括一个链接,然后是更多文本。我需要做的是跳过那个跨度继续阅读文本。也许我的问题应该是,你如何跳过一个跨度?感谢您的关注。
编辑#2 好吧,我要开始赏金了。我真的需要一些帮助。我到处寻找,并尝试了很多不同的东西。但没有什么对我有用。在那一个封闭的跨度之后,我无法获得文本。而且这种格式经常出现。我正在为应用程序解析的博客的作者有时会更改她的文字样式,并且在她更改样式后我无法获取文本。任何帮助,将不胜感激。再次感谢您的关注。
编辑#3 这是 DOM 树 HTML 的另一个屏幕截图。如果你能注意到我正在解析 div 类的“条目内容”,那么有问题的文本就会暴露出来。以“今天...”开头,然后更改文本颜色的跨度,我可以得到该文本。我需要的是之后的文本,“它是一个......”就在关闭 p 标签之前。
我还将整个 HTML 放在了要点上。在这里。有问题的行是 102。虽然 HTML 没有很好地复制。谢谢。