好吧,这让我发疯了。我正在尝试使用 phpQuery 对以下看似微不足道的 HTML 进行屏幕抓取:
<td><nobr>10-05-2009</nobr><br>06:10<br>17:35 -1</td>
日期很简单,因为它包含在 nobr 标签中,例如。$element[':first-child']->text()
成功了。 但是,如何在第二段文字上戴上脏兮兮的手套呢?
CSS 仅适用于元素,因此nth-child(2),(3)
返回周围的<br>
标签,而不是文本。
如果我可以 XPath 它,第二个节点.//text()
将是黄金。但显然在 phpQuery-land 中,上下文$element->xpath->query('.//text()')
是文档根目录,所以我得到了整个文档中的每一段文本!
想法?如何使用 jQuery 选择文本节点中的所有解决方案?似乎涉及到 Javascript DOM 操作,这比 PHP 糟糕的 DOM API 要少得多。也许只是将整个元素转储到字符串并爆炸它<br>
是要走的路......