我正在使用 Symfony DomCrawler 获取文档中的所有文本。
$this->crawler->filter('p')->each(function (Crawler $node, $i) {
// process text
});
我正在尝试收集<body>
元素之外的所有文本。
<body>
This is an example
<p>
blablabla
</p>
another example
<p>
<span>Yo!</span>
again, another piece of text <br/>
with an annoy BR in the middle
</p>
</body>
我正在使用 PHP Symfony,可以使用 XPath(首选)或 RegEx。