0

嗨,我只是想掌握正则表达式,我一直在尝试从该网站提取内容,但我认为我的正则表达式有问题,因为我无法向数组中添加任何内容。谁能指出我正确的方向,我认为它只是一件小事。

谢谢

<?php   
    $f1 = fopen("http://www.irishexaminer.com/","r");
    $document = fread($f1,100000);
    fclose($f1);
    $regexp = "%<p>(.+)</p><p>%";
    preg_match($regexp,$document,$getHeading);  
    echo "<br>" . $getHeading[1];
    echo '<pre>';
    print_r($getHeading);
    echo '</pre>';
?>
4

1 回答 1

1

在您的情况下, p 的结束标签中没有空格的借口。

<p> THERE is no excuse for loyalist violence on the streets of Belfast.<p /><p>

正则表达式匹配

%<p>(.+)</\s*p><p>%

使正则表达式对 HTML 具有足够的弹性需要一段时间。也接受 Frankies 的建议。将你的努力投入到不太容易失败的事情上。你可以使用PHP HTML Tidy

于 2013-01-10T16:33:09.297 回答