-1

在 PHP 中匹配/比较文本字符串

大家好,我正在尝试比较一些字符串,基本上是为了了解我是否在产品提要中有产品。由于来源不同,完美匹配(相同)并不是确定的事情。由于产品名称有时包含或多或少的字符(iPad 白色和 iPad Apple 白色),我想进行近似匹配,可能与 Lucene 中的模糊搜索(~)类似。

到目前为止,我知道并使用了 preg_match 和 levenshtein。你能推荐任何其他方法来为 PHP 的字符串进行相似性匹配吗?

4

1 回答 1

2

您问是否有人对使用有想法:嗯,这是PHP网站上的一个示例,但我想它可以帮助您。

(我已经修改了代码以可能适合您网站上的一种体验):

<?php

$productString= 'Apple white IPOD';

// array of words to check against
$products = array('zen','dell laptop','apple laptop','apple black ipod',
                'apple mini','Random product');

// no shortest distance found, yet
$shortest = -1;

// loop through products to find the closest product
foreach ($products as $product) {

    // calculate the distance between the input word,
    // and the current word
    $lev = levenshtein($productString, $product);

    // check for an exact match
    if ($lev == 0) {

        // closest word is this one (exact match)
        $closest = $product;
        $shortest = 0;

        // break out of the loop; we've found an exact match
        break;
    }

    // if this distance is less than the next found shortest
    // distance, OR if a next shortest word has not yet been found
    if ($lev <= $shortest || $shortest < 0) {
        // set the closest match, and shortest distance
        $closest  = $word;
        $shortest = $lev;
    }
}

echo "Search product: $productString\n";
if ($shortest == 0) {
    echo "Exact match found: $closest\n";
} else {
    echo "Did you mean: $closest?\n";
}

?>

上面的代码搜索产品列表、数组,并找到最接近的匹配项。如果找到完全匹配,则使用它来代替。

于 2013-04-02T14:25:58.020 回答