8

有没有办法用相同的语法在 PHP 中模拟 SQL 的 LIKE 运算符?(%以及_通配符和通用$escape转义字符)?所以具有:

$value LIKE $string ESCAPE $escape

你可以有一个函数来返回 PHP 评估而不使用数据库?(考虑$value,$string$escape值已经设置)。

4

4 回答 4

4

这基本上就是你将如何实现这样的事情:

$input = '%ST!_ING_!%';
$value = 'ANYCHARS HERE TEST_INGS%';

// Mapping of wildcards to their PCRE equivalents
$wildcards = array( '%' => '.*?', '_' => '.');

// Escape character for preventing wildcard functionality on a wildcard
$escape = '!';

// Shouldn't have to modify much below this

$delimiter = '/'; // regex delimiter

// Quote the escape characters and the wildcard characters
$quoted_escape = preg_quote( $escape);
$quoted_wildcards = array_map( function( $el) { return preg_quote( $el); }, array_keys( $wildcards));

// Form the dynamic regex for the wildcards by replacing the "fake" wildcards with PRCE ones
$temp_regex = '((?:' . $quoted_escape . ')?)(' . implode( '|', $quoted_wildcards) . ')';

// Escape the regex delimiter if it's present within the regex
$wildcard_replacement_regex = $delimiter . str_replace( $delimiter, '\\' . $delimiter, $temp_regex) . $delimiter;

// Do the actual replacement
$regex = preg_replace_callback( $wildcard_replacement_regex, function( $matches) use( $wildcards) { return !empty( $matches[1]) ? preg_quote( $matches[2]) : $wildcards[$matches[2]]; }, preg_quote( $input)); 

// Finally, test the regex against the input $value, escaping the delimiter if it's present
preg_match( $delimiter . str_replace( $delimiter, '\\' . $delimiter, $regex) . $delimiter .'i', $value, $matches);

// Output is in $matches[0] if there was a match
var_dump( $matches[0]);

这形成了一个动态的正则表达式,基于$wildcards并且$escape为了用它们的 PCRE 等价物替换所有“假”通配符,除非“假”通配符以转义字符为前缀,在这种情况下,不进行替换。为了进行这种替换,$wildcard_replacement_regex创建了 。

$wildcard_replacement_regex一旦一切都说完了,看起来像这样:

/((?:\!)?)(%|_)/

因此它使用两个捕获组来(可选地)抓取转义字符和通配符之一。这使我们能够测试它是否在回调中抓取了转义字符。如果能够在通配符之前获得转义字符,$matches[1]则将包含转义字符。如果没有,$matches[1]将是空的。这就是我如何确定是否将通配符替换为其 PCRE 等效项,或者仅通过preg_quote()-ing 将其保留。

你可以在 codepad上玩它。

于 2012-07-11T14:06:27.700 回答
4

好的,经过很多乐趣和游戏,这就是我想出的:

function preg_sql_like ($input, $pattern, $escape = '\\') {

    // Split the pattern into special sequences and the rest
    $expr = '/((?:'.preg_quote($escape, '/').')?(?:'.preg_quote($escape, '/').'|%|_))/';
    $parts = preg_split($expr, $pattern, -1, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY);

    // Loop the split parts and convert/escape as necessary to build regex
    $expr = '/^';
    $lastWasPercent = FALSE;
    foreach ($parts as $part) {
        switch ($part) {
            case $escape.$escape:
                $expr .= preg_quote($escape, '/');
                break;
            case $escape.'%':
                $expr .= '%';
                break;
            case $escape.'_':
                $expr .= '_';
                break;
            case '%':
                if (!$lastWasPercent) {
                    $expr .= '.*?';
                }
                break;
            case '_':
                $expr .= '.';
                break;
            default:
                $expr .= preg_quote($part, '/');
                break;
        }
        $lastWasPercent = $part == '%';
    }
    $expr .= '$/i';

    // Look for a match and return bool
    return (bool) preg_match($expr, $input);

}

我不能打破它,也许你可以找到一些东西。我的与@nickb 不同的主要方式是我将输入表达式“解析”(ish)为标记以生成正则表达式,而不是将其原位转换为正则表达式。

函数的前 3 个参数应该是不言自明的。第四个允许您通过PCRE 修饰符来影响用于匹配的最终正则表达式。我把它放进去的主要原因是允许你通过i,所以它不区分大小写——我想不出任何其他可以安全使用的修饰符,但情况可能并非如此。 根据下面的评论删除

函数只返回一个布尔值,指示$input文本是否匹配$pattern

这是它的键盘

编辑哎呀,坏了,现在修好了。新的键盘

编辑删除了第四个参数,并根据下面的评论使所有匹配不区分大小写

编辑几个小的修复/改进:

  • 向生成的正则表达式添加了字符串断言的开始/结束
  • 添加了对最后一个令牌的跟踪以避免.*?生成的正则表达式中的多个序列
于 2012-07-11T15:56:59.437 回答
1

您可以使用正则表达式,例如:preg_match.

于 2012-07-11T13:59:39.473 回答
1

其他的例子对我来说有点太复杂了(而且对我干净的代码眼睛来说很痛苦),所以我用这个简单的方法重新实现了这个功能:

public function like($needle, $haystack, $delimiter = '~')
{
    // Escape meta-characters from the string so that they don't gain special significance in the regex
    $needle = preg_quote($needle, $delimiter);

    // Replace SQL wildcards with regex wildcards
    $needle = str_replace('%', '.*?', $needle);
    $needle = str_replace('_', '.', $needle);

    // Add delimiters, beginning + end of line and modifiers
    $needle = $delimiter . '^' . $needle . '$' . $delimiter . 'isu';

    // Matches are not useful in this case; we just need to know whether or not the needle was found.
    return (bool) preg_match($needle, $haystack);
}

修饰符

  • i: 忽略大小写。
  • s:使点元字符匹配任何内容,包括换行符。
  • u: UTF-8 兼容性。
于 2015-08-18T20:49:39.020 回答