0

我正在尝试解析格式错误的 html 表:

其中有几行是:

  Food:</b> Yes<b><br>
 Pool: </b>Beach<b></b><b><br>
  Centre:</b> Yes<b><br>

使用 php 的 domdocument xpath 我可以选择所有的标题标签,比如 Food、center 和 pool,但是一旦我有了每个我想向前搜索,直到我点击下一个标题标签。

我知道正则表达式可以期待一个特定的模式。xpath 可以为特定标签做同样的事情吗?

谢谢,

账单

4

1 回答 1

1

使用 following-sibling::br[1]/following-sibling::text()[1] 似乎是您所需要的。

但是,在对结构不佳的数据进行复杂查询时,最好的建议通常是先进行 XSLT 转换以创建更好的结构。

于 2012-09-17T21:31:08.183 回答