6

我想创建一个网站,用户可以在其中测试正则表达式(已经有很多......比如这个: http: //www.pagecolumn.com/tool/pregtest.htm)。基本上,用户提供一个正则表达式和一些示例文本,然后将正则表达式评估的结果吐回。

我想使用 PHP“preg_*”函数评估服务器端的正则表达式。有没有办法清理提供的正则表达式?我应该关注哪些安全漏洞?

4

5 回答 5

3

我认为 PHP 本身会检查正则表达式。这是我制作的示例脚本:

// check for input, and set max size of input
if(@!empty($_POST['regex'])
    && @!empty($_POST['text'])
    && strlen($_POST['regex'])<1000
    && strlen($_POST['text'])<2000
    ){
    // set script timeout in case something goes wrong (SAFE MODE must be OFF)
    $old_time=ini_get('max_execution_time');
    if(!set_time_limit(1)) die('SAFE MODE MUST BE OFF'); // 1 sec is more then enough

    // trim input, it's up to you to do more checks
    $regex=trim($_POST['regex']);
    // don't trim the text, it can be needed
    $input=$_POST['text'];
    // escape slashes
    $regex=preg_replace('/([\\/]+)?//', '\/', $regex);

    // go for the regex
    if(false===$matched=@preg_match('/'.$regex.'/', $input, $matches)){
            // regex was tested, show results
            echo 'Matches: '.$matched.'<br />';
            if($matched>0){
                    echo 'matches: <br />';
                    foreach($matches as $i =>  $match){
                            echo $i.' = '.$match.'<br />';
                }
            }
    }
    // set back original execution time
    set_time_limit($old_time);
}

无论如何,永远不要将 eval() 与用户提交的字符串一起使用

此外,您可以进行一些简单的简约消毒,但这取决于您。;)

于 2010-03-03T13:54:07.763 回答
1

如果您允许用户提交的值,请preg_replace 确保您不允许该e标志!不这样做可能会让恶意用户删除您的整个网站,或者更糟。

否则,可能发生的最糟糕的事情就是其他答案已经指出的。设置一个较低的脚本超时时间,也许您甚至应该确保该页面每分钟只能被调用 X 次。

于 2010-03-03T13:53:00.120 回答
0

我能想到的唯一问题是有人可以通过输入一个错误的正则表达式(即 O(2^n) 或 O(n!) 或其他)来对你进行 DOS,而防止这种情况的最简单方法可能是设置你的页面超时时间短。

于 2010-03-03T13:18:02.190 回答
0

如果正则表达式存储在数据库中,您应该使用通常用来转义数据的任何方法,例如准备好的语句。

否则,我唯一担心的是用户可能会提供恶意的正则表达式,因为它可能包含一个非常复杂的正则表达式,我不确定是否有办法检查它。

一种想法是,您可以通过在 JS 中执行它来使您的正则表达式评估器成为所有客户端,但是 php 的 preg 函数和 JavaScript 正则表达式函数之间存在不一致。

于 2010-03-03T13:20:38.127 回答
0

Afaik 现在在尝试评估用户提供的正则表达式时存在“漏洞”。可能发生的最糟糕的事情是 - 就像 erik 指出的那样 - 脚本中的 DOS 攻击或致命错误。

恐怕要告诉您,您将无法(甚至在理论上)能够“清理”所有可能的正则表达式。您能做的最好的事情就是检查词法和/或句法错误。

于 2010-03-03T13:22:00.870 回答