1

你好,我的模式是:

'<span\s+id="bodyHolder_newstextDetail_nwstxtPicPane"><a\s+href="(.*)"\s+target="_blank"><img\s+alt="(.*)"\s+title="(.*)"\s+src=\'(.*)\'\s+/>'

和字符串:

<div class="nwstxtpic">
                        <span id="bodyHolder_newstextDetail_nwstxtPicPane"><a href="xxxxx" target="_blank"><img alt="xxxxx" title="xxxxx" src='xxxxx' />

好吧,我用于查找和获取我在 patern 中定义的 4 个组的值的 php 代码是:

$picinfo=preg_match_all('/<span\s+id="bodyHolder_newstextDetail_nwstxtPicPane"><a\s+href="(.*)"\s+target="_blank"><img\s+alt="(.*)"\s+title="(.*)"\s+src=\'(.*)\'\s+/>/',$newscontent,$matches);
foreach ($matches[0] as $match) {
    echo $match;
}

我不知道如何获得这4组的价值

href="(.*)"

alt="(.*)"

title="(.*)"

src=\'(.*)\'

请你帮帮我?谢谢你。

4

2 回答 2

6

preg_match_all() 默认按模式顺序返回结果,不太方便。传递 PREG_SET_ORDER 标志,以便以更合乎逻辑的方式排列数据:

$newscontent='<span id="bodyHolder_newstextDetail_nwstxtPicPane"><a href="xxxxx" target="_blank"><img alt="xxxxx" title="xxxxx" src=\'xxxxxbb\' />'; 

$picinfo=preg_match_all('/<span\s+id="bodyHolder_newstextDetail_nwstxtPicPane"><a\s+href="(.*)"\s+target="_blank"><img\s+alt="(.*)"\s+title="(.*)"\s+src=\'(.*)\'\s+\/>/',$newscontent,$matches,PREG_SET_ORDER);
foreach ($matches as $match) {
    $href = $match[1];
    $alt = $match[2];
    $title = $match[3];
    $src = $match[4];
    echo $title;
}
于 2012-08-13T11:05:43.813 回答
1

正如手册所说,您的 RegEx 是正确的,默认情况下PREG_PATTERN_ORDER遵循哪个命令结果,因此这$matches[0]是一个完整模式匹配的数组,$matches[1]是一个与第一个带括号的子模式匹配的字符串数组,依此类推。

因此,在您的情况下, $matches 1将包含 href, $matches 2将包含 alt 等等。喜欢,

for($i = 0; $i <= count($matches[0]); $i++ )
     echo "href = {$matches[1][$i]}, alt = {$matches[2][$i]}";

$matches[0]将包含完全匹配的字符串。

顺便说一句,总是建议使用 XML 解析器,试试 DOMDocument。强制性的

于 2012-08-13T11:03:22.067 回答