我有一个正则表达式,如果输入错误,它似乎会停止工作。
我的代码:
function dbStr($string)
{
private static $tag = "(script|embed)";//As it turns out, embeds have the exact same syntax as scripts, so, we can use the same regexes against those :)
private static $tvnc = "(\\\\'|\\\\\"|[^<>\"'/])*?";//Tag Valid No Close
private static $quoteseq = "['\"](\\\\'|\\\\\"|[^\"'])*?['\"]";
private static $tvncq = "(".$tvnc.$quoteseq.$tvnc.")*?";//Tag Valid No Close Quotes
$string = preg_replace_callback
(
"#<".$tvnc.$tag."(".$tvncq."(src=".$quoteseq.")".$tvncq.")/>#imsSX",//Pattern
"dbStr_FilterSinglematch",//Callback
$string//Subject
);
return $string;
}
function dbStr_FilterSinglematch($m)
{
print_r($m);
return "";
}
现在,假设我称之为输入:
echo "\n" . dbStr
("
<script type='textjavascript' src='asdf'/>
<script type='textjavascript' src='asdf'>
asdfasfasdf
uyoiyoiuyoiuy
");
它工作正常!它找到一个匹配项,并删除该匹配项。这是我从该调用发送的输出:
Array
(
[0] => <script type='textjavascript' src='asdf'/>
[1] =>
[2] => script
[3] => type='textjavascript' src='asdf'
[4] => type='textjavascript'
[5] => =
[6] => t
[7] =>
[8] => src='asdf'
[9] => f
)
<script type='textjavascript' src='asdf'>
asdfasfasdf
uyoiyoiuyoiuy
但是,如果我给它这个输入而不是......
echo "test" . dbStr
(
'
<embed type="application/x-shockwave-flash" src="http://picasaweb.google.com/s/c/bin/slideshow.swf" width="288" height="192" flashvars="host=picasaweb.google.com&hl=en_US&feat=flashalbum&RGB=0x000000&feed=http%3A%2F%2Fpicasaweb.google.com%2Fdata%2Ffeed%2Fapi%2Fuser%2F109941697484668010012%2Falbumid%2F5561383933745906193%3Falt%3Drss%26kind%3Dphoto%26authkey%3DGv1sRgCN2H88H41qeT6AE%26hl%3Den_US" pluginspage="http://www.macromedia.com/go/getflashplayer"></embed>
'.
"
<script type='textjavascript' src='asdf'/>
<script fubar=\"d\\\\\'erp\" derp=\"dlerp\">
//<script type='text/javascript' src='asdf'/>
asdfasfasdf
</script>
<script>
uyoiyoiuyoiuy
</script>
");
没有什么。什么都没有。没有找到匹配项,但我从正则表达式中得到的文本是完全空白的!
我的意思是,说真的……什么鬼?这是我运行上述代码得到的输出:
test
对,就是那样。
如果正则表达式找到任何匹配项(例如,匹配整个文档),那么它不会从我的 print_r() 调用中输出一些内容吗?不,我认为它甚至不会调用回调。正则表达式完全失败了。
更糟糕的是,我设置了以下 headers/ini 设置:
header('Content-type: text/plain');
error_reporting(E_ALL);
ini_set("display_errors", 1);
但是我在我的日志中或在其自身的输出中都没有看到任何错误!
所以,你有它,我的正则表达式困境。有没有人知道为什么这会失败?
编辑:
我缩小了问题的根源:
echo "test " . dbStr
('<embed tests="abc" tests="abc" flashvars="AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA"></embed>');
似乎当我有两个这么长的属性,然后是一个很长的属性时,系统崩溃了。但是,这个输入不会崩溃......:(有更多的 A,但没有前面的标签)
echo "test " . dbStr
('<embed
flashvarsembed>');
话虽如此,添加了 A 的前面的标签现在只需要这么长就可以让它崩溃:
echo "test " . dbStr
('<embed a="b" c="d"
flashvarsembed>');
看来这是一个与内存相关的问题......有解决办法吗?这将解析的代码可能非常长。