1

这是我目前正在处理的一个奇怪的扳手。我一直在使用它,使用各种正则表达式、间距和引号变体,但似乎只有结束</a>标记的位置存在问题。

我已经构建了一个 RegEx 解析器(我知道)来从 HTML 输出中获取标签,并从我们称为“短代码”的库中为每个标签触发自定义闭包。它只是将标签换成闭包的返回值,如果闭包不存在,则将标签留在原处。

当它</a>与我正在抓取的标签放在同一行时,它会导致preg_replace_callback失败。当我添加换行符时,一切都完美无缺。我们在所有地方都使用这些标签作为我们模板系统的核心部分,并且它们在其他所有实例中都运行良好。

所以我的问题是……为什么?!这是一个错误还是我是错误?

编辑:更新模式以限制不情愿。关闭</a>标签仍然会终止该进程。(@艾伦摩尔)

编辑2:所以,正则表达式是罪魁祸首。在某些情况下,它会在同一行的标签之外拉入内容,但这种模式解决了问题 - '#\[\s*(\w[^\]\s]*)(.*?)\s*\]#i'.

失败的 HTML

<div>
    <a href="[ make_url post_id='200' ]">Some Link</a>
</div>

成功的 HTML

<div>
    <a href="[ make_url post_id='200' ]">
        Some Link
    </a>
</div>

或者

<div>
    <a href="[ make_url post_id='200' ]">Some Link
    </a>
</div>

PHP

没什么特别的,即使我把它简化为基础,它仍然失败。

$content = 'HTML output from an output buffer';
//$old_pattern = '#\[\s*?(\w+?(?:\.?\w+?)*?(?=\s|\]))(.+)*?\s*?\]#i';
$pattern = '#\[\s*(\w+(?:\.?\w+)*(?=\s|\]))(.+)\s*\]#i';

$content = preg_replace_callback( $pattern, function( $matches ) {
    // Do things with the matches
}, $content );

// Send content back to the template
return $content;
4

2 回答 2

0

嗯,像这样基本的东西不适合你吗?

/<a.*?(\[.*?\]).*?>.*?<\/a>/is

例如

$matches = null;
$result = 
    preg_match_all('/<a.*?(\[.*?\]).*?>.*?<\/a>/is', '
        <div>
            <a href="[ make_url post_id=\'200\' ]">Some Link</a>
        </div>
        <div>
            <a href="[ make_url post_id=\'200\' ]">
                Some Link
            </a>
        </div>
        <div>
            <a href="[ make_url post_id=\'200\' ]">Some Link
            </a>
        </div>
    ', $matches);
var_dump($matches);

http://codepad.viper-7.com/PM70m1

于 2012-09-13T01:05:43.203 回答
0

事实证明,正则表达式是罪魁祸首。在某些情况下,它会在同一行的标签之外拉入内容,但这种模式解决了问题 - #\[\s*(\w[^\]\s]*)(.*?)\s*\]#i.

于 2012-09-19T13:57:18.167 回答