在 PHP 中匹配/比较文本字符串
大家好,我正在尝试比较一些字符串,基本上是为了了解我是否在产品提要中有产品。由于来源不同,完美匹配(相同)并不是确定的事情。由于产品名称有时包含或多或少的字符(iPad 白色和 iPad Apple 白色),我想进行近似匹配,可能与 Lucene 中的模糊搜索(~)类似。
到目前为止,我知道并使用了 preg_match 和 levenshtein。你能推荐任何其他方法来为 PHP 的字符串进行相似性匹配吗?
在 PHP 中匹配/比较文本字符串
大家好,我正在尝试比较一些字符串,基本上是为了了解我是否在产品提要中有产品。由于来源不同,完美匹配(相同)并不是确定的事情。由于产品名称有时包含或多或少的字符(iPad 白色和 iPad Apple 白色),我想进行近似匹配,可能与 Lucene 中的模糊搜索(~)类似。
到目前为止,我知道并使用了 preg_match 和 levenshtein。你能推荐任何其他方法来为 PHP 的字符串进行相似性匹配吗?
您问是否有人对使用有想法:嗯,这是PHP
网站上的一个示例,但我想它可以帮助您。
(我已经修改了代码以可能适合您网站上的一种体验):
<?php
$productString= 'Apple white IPOD';
// array of words to check against
$products = array('zen','dell laptop','apple laptop','apple black ipod',
'apple mini','Random product');
// no shortest distance found, yet
$shortest = -1;
// loop through products to find the closest product
foreach ($products as $product) {
// calculate the distance between the input word,
// and the current word
$lev = levenshtein($productString, $product);
// check for an exact match
if ($lev == 0) {
// closest word is this one (exact match)
$closest = $product;
$shortest = 0;
// break out of the loop; we've found an exact match
break;
}
// if this distance is less than the next found shortest
// distance, OR if a next shortest word has not yet been found
if ($lev <= $shortest || $shortest < 0) {
// set the closest match, and shortest distance
$closest = $word;
$shortest = $lev;
}
}
echo "Search product: $productString\n";
if ($shortest == 0) {
echo "Exact match found: $closest\n";
} else {
echo "Did you mean: $closest?\n";
}
?>
上面的代码搜索产品列表、数组,并找到最接近的匹配项。如果找到完全匹配,则使用它来代替。