0

我有一个正则表达式,如果输入错误,它似乎会停止工作。

我的代码:

function dbStr($string)
{
    private static $tag = "(script|embed)";//As it turns out, embeds have the exact same syntax as scripts, so, we can use the same regexes against those :)
    private static $tvnc = "(\\\\'|\\\\\"|[^<>\"'/])*?";//Tag Valid No Close
    private static $quoteseq = "['\"](\\\\'|\\\\\"|[^\"'])*?['\"]";
    private static $tvncq = "(".$tvnc.$quoteseq.$tvnc.")*?";//Tag Valid No Close Quotes


    $string = preg_replace_callback
    (
        "#<".$tvnc.$tag."(".$tvncq."(src=".$quoteseq.")".$tvncq.")/>#imsSX",//Pattern
        "dbStr_FilterSinglematch",//Callback
        $string//Subject
    );
    return $string;
}

function dbStr_FilterSinglematch($m)
{
    print_r($m);
    return "";
}

现在,假设我称之为输入:

echo "\n" . dbStr
("







<script type='textjavascript' src='asdf'/>

    <script type='textjavascript' src='asdf'>
    asdfasfasdf


    uyoiyoiuyoiuy

");

它工作正常!它找到一个匹配项,并删除该匹配项。这是我从该调用发送的输出:

Array
(
    [0] => <script type='textjavascript' src='asdf'/>
    [1] => 
    [2] => script
    [3] =>  type='textjavascript' src='asdf'
    [4] =>  type='textjavascript' 
    [5] => =
    [6] => t
    [7] =>  
    [8] => src='asdf'
    [9] => f
)











    <script type='textjavascript' src='asdf'>
    asdfasfasdf


    uyoiyoiuyoiuy

但是,如果我给它这个输入而不是......

echo "test" . dbStr
(
'

<embed type="application/x-shockwave-flash" src="http://picasaweb.google.com/s/c/bin/slideshow.swf" width="288" height="192" flashvars="host=picasaweb.google.com&amp;hl=en_US&amp;feat=flashalbum&amp;RGB=0x000000&amp;feed=http%3A%2F%2Fpicasaweb.google.com%2Fdata%2Ffeed%2Fapi%2Fuser%2F109941697484668010012%2Falbumid%2F5561383933745906193%3Falt%3Drss%26kind%3Dphoto%26authkey%3DGv1sRgCN2H88H41qeT6AE%26hl%3Den_US" pluginspage="http://www.macromedia.com/go/getflashplayer"></embed>

'.

"



<script type='textjavascript' src='asdf'/>
<script  fubar=\"d\\\\\'erp\"  derp=\"dlerp\">
    //<script type='text/javascript' src='asdf'/>
    asdfasfasdf
</script>
<script>
    uyoiyoiuyoiuy
</script>
");

没有什么。什么都没有。没有找到匹配项,但我从正则表达式中得到的文本是完全空白的!

我的意思是,说真的……什么鬼?这是我运行上述代码得到的输出:

test 

对,就是那样。

如果正则表达式找到任何匹配项(例如,匹配整个文档),那么它不会从我的 print_r() 调用中输出一些内容吗?不,我认为它甚至不会调用回调。正则表达式完全失败了。

更糟糕的是,我设置了以下 headers/ini 设置:

header('Content-type: text/plain');
error_reporting(E_ALL);
ini_set("display_errors", 1);

但是我在我的日志中或在其自身的输出中都没有看到任何错误!

所以,你有它,我的正则表达式困境。有没有人知道为什么这会失败?

编辑:

我缩小了问题的根源:

echo "test " . dbStr
('<embed tests="abc" tests="abc" flashvars="AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA"></embed>');

似乎当我有两个这么长的属性,然后是一个很长的属性时,系统崩溃了。但是,这个输入不会崩溃......:(有更多的 A,但没有前面的标签)

echo "test " . dbStr
('<embed
flashvarsembed>');

话虽如此,添加了 A 的前面的标签现在只需要这么长就可以让它崩溃:

echo "test " . dbStr
('<embed a="b" c="d"
flashvarsembed>');

看来这是一个与内存相关的问题......有解决办法吗?这将解析的代码可能非常长。

4

0 回答 0