0

最近我正在研究一个BBS的不良内容(例如广告帖子)过滤器。我编写了一个函数来检测一个字符串是否在另一个字符串中不连续。代码如下:

$str = 'helloguys';
$substr1 = 'hlu';
$substr2 = 'elf';

function detect($a,$b) //function that detect a in b
{
    $c = '';
    for($i=0;$i<=strlen($a);$i++)
    {
        for($j=0;$j<=strlen($b);$j++)
        {
            if($a[$i] == $b[$j])
            {
               $b=substr($b,$j+1);
               $c .=$a[$i];
               break;
            }
        }
    }
    if($c == $a) return true;
    else return false;
}

var_dump(detect($substr1,$str)); //true
var_dump(detect($substr2,$str)); //false

由于过滤器在用户发布帖子之前起作用,所以我认为这里的效率很重要。我想知道是否有更好的解决方案?谢谢!

4

2 回答 2

1

一种更快的方法是将 $a 转换为正则表达式并将其与 $b 匹配,这样您只需将优化留给用 C 代码编写的 PCRE 模块本身。

例如:

detect("hlu",$b) is equal to preg_match("/h.*l.*u/", $b)
(detect("hlu",$b) && detect("elf",$b)) is equal to preg_match("/(h.*l.*u|e.*l.*f)/", $b)
于 2010-05-21T05:24:06.007 回答
0

不知道你为什么要这样做。但我很无聊

function detect( $a,$b ) {

    return count( array_intersect( str_split($b), str_split($a) ) ) == strlen($b);

}
于 2010-05-21T05:31:31.253 回答