-1

问题:

试图从我可以通过 PHP 获得的 HTML 代码中提取特定文本。

HTML 代码:

<a href="/debatt/s-vill-ha-tioarig-skolplikt-och-farre-elever-i-klassen">
    <span class="number">2. </span>Skolplikt och färre elever i klassen
    <br />
    <span class="metadata">I går</span>
</a>

<a href="/sthlm/edholm-backar-om-skolornas-smorforbud">
    <span class="number">3. </span>Edholm backar om skolornas smörförbud
    <br />
    <span class="metadata">16 okt</span>
</a>

期望的输出:

2. Skolplikt och färre elever i klassen
3. Edholm backar om skolornas smörförbud

两个代码示例具有相同的 HTML 结构。是否可以通过简单的 HTML DOM 来做到这一点,还是应该追求正则表达式?

4

2 回答 2

2

将 HTML 添加到DOMElement对象中。有了它,您可以选择孩子并将他们的 HTML/文本提取到变量中。

文档: http: //php.net/manual/en/class.domelement.php


与https://stackoverflow.com/a/12950525/711129的答案相同

于 2012-10-18T09:00:28.580 回答
1

如果你必须经常这样做,你可以使用一个非常方便和简单的类来解析 html dom。

http://simplehtmldom.sourceforge.net/

于 2012-10-18T09:07:13.290 回答