0

我正在写一个留言板,允许引用和引用其他用户的链接。留言板允许某些 html 标签,包括<img>. 引用消息时,我想找到<img>并用缩略图替换图片。这是我当前的代码:

<?php
 $pattern = "<quote msgid=\"t,(\d+),(\d+)@(\d+)\" from=\"([A-z0-9_\.-]+)\" posted=\"(\d+)\">(.+)<img src=\"https?:\/\/i\.(minus|imgur)\.com\/([A-z0-9_\.-]+)\.(jpg|gif|png|jpeg)\"( \/)?>";
 $replace = "<div class=\"quoted-message\" msgid=\"t,$1,$2@$3\"><div class=\"message-top\">From: $4 | Posted: $5</div>$6<img src=\"http:\/\/$7.com\/$8s\.$9\" />";
 $encoded = preg_replace($pattern, $replace, $encoded);
?>

该模式本身有效,但我遇到的问题是它不能很好地使用嵌套引号。例如,数据可能如下所示:

<quote msgid="t,1234,3456@0" from"user" posted="test">Some words here<quote msgid="t,5635,57456@0" from"user2" posted="test">Some more <b>words</b> here<quote msgid="t,1243532,3452@0" from"user" posted="test">Something else here<img src="linktoimage"/></quote>some words can go here</quote>or here</quote>

我当前的正则表达式将用一个 div 标签替换前 3 个开头引号标签,而不仅仅是匹配最内部的标签。我知道它与 the 有关,(.+)但我不知道我还能做些什么来检查先前的数据。

任何帮助将不胜感激。

4

2 回答 2

1

正则表达式不太适合您的情况(这里解释得很奇怪)。你真的应该使用解析器。

于 2012-04-21T03:27:20.613 回答
0

(?!<quote.*?<quote)(<quote)

匹配最里面的引号标签。

http://regexr.com?30ng2

于 2012-04-21T03:46:04.443 回答