这是我目前正在处理的一个奇怪的扳手。我一直在使用它,使用各种正则表达式、间距和引号变体,但似乎只有结束</a>
标记的位置存在问题。
我已经构建了一个 RegEx 解析器(我知道)来从 HTML 输出中获取标签,并从我们称为“短代码”的库中为每个标签触发自定义闭包。它只是将标签换成闭包的返回值,如果闭包不存在,则将标签留在原处。
当它</a>
与我正在抓取的标签放在同一行时,它会导致preg_replace_callback
失败。当我添加换行符时,一切都完美无缺。我们在所有地方都使用这些标签作为我们模板系统的核心部分,并且它们在其他所有实例中都运行良好。
所以我的问题是……为什么?!这是一个错误还是我是错误?
编辑:更新模式以限制不情愿。关闭</a>
标签仍然会终止该进程。(@艾伦摩尔)
编辑2:所以,正则表达式是罪魁祸首。在某些情况下,它会在同一行的标签之外拉入内容,但这种模式解决了问题 - '#\[\s*(\w[^\]\s]*)(.*?)\s*\]#i'
.
失败的 HTML
<div>
<a href="[ make_url post_id='200' ]">Some Link</a>
</div>
成功的 HTML
<div>
<a href="[ make_url post_id='200' ]">
Some Link
</a>
</div>
或者
<div>
<a href="[ make_url post_id='200' ]">Some Link
</a>
</div>
PHP
没什么特别的,即使我把它简化为基础,它仍然失败。
$content = 'HTML output from an output buffer';
//$old_pattern = '#\[\s*?(\w+?(?:\.?\w+?)*?(?=\s|\]))(.+)*?\s*?\]#i';
$pattern = '#\[\s*(\w+(?:\.?\w+)*(?=\s|\]))(.+)\s*\]#i';
$content = preg_replace_callback( $pattern, function( $matches ) {
// Do things with the matches
}, $content );
// Send content back to the template
return $content;