0

可能的重复:
PHP MySQL 搜索和按相关性排序

你好,

我有一个包含多个列的表,其中包含名称、地址、公司等字段。假设有人搜索“microsoft john”。我希望首先出现包含“microsoft”的结果,然后是包含 john. 如果查询是“john microsoft”,反之亦然

我的PHP代码是:

$searchitems=explode(" ", $trimmed);
//print_r($searchitems);
$so = $_GET['so']=='2'?"2":"1";

$clause = $so=='2'?"AND":"OR";
include("dbconnect.php");
// Build SQL Query

$query = "select FirstName,LastName,course,Department,batch,City,companyjob,companylocation,
    companyposition,coursename,institutename,coursename2,institutename2,coursename3,
    institutename3 from alumni WHERE ";
for($i=0;$i<count($searchitems);$i++)
{
    $queryappend .= "(FirstName LIKE '".$searchitems[$i]."%' OR LastName LIKE '".$searchitems[$i]."%'
    OR City LIKE '".$searchitems[$i]."%' OR CountryorRegion LIKE '".$searchitems[$i]."%'
    OR companyjob LIKE '".$searchitems[$i]."%' OR companylocation LIKE '".$searchitems[$i]."%'
    OR coursename LIKE '".$searchitems[$i]."%' OR institutename LIKE '".$searchitems[$i]."%'
    OR coursename2 LIKE '".$searchitems[$i]."%' OR institutename2 LIKE '".$searchitems[$i]."%')";
    if($i<count($searchitems)-1) $queryappend .= $clause;

}
$query .=$queryappend;

问题是 MYSQL 是按 id 排序结果...这很有趣,因为一些更高价值的结果可能会卡在堆栈的深处。顺便说一句,phpmyadmin 搜索也有同样的缺陷。

请建议。

4

2 回答 2

2

举个例子:

SELECT
  FirstName,
  LastName,
  IF (FirstName LIKE '%Microsoft%' || LastName LIKE '%Microsoft%', 1, 0) AS One,
  IF (FirstName LIKE '%John%' || LastName LIKE '%John%', 1, 0) AS Two
FROM alumni
ORDER BY One DESC, Two DESC

在您的代码中,这将使查询变得非常复杂。优点是,具有两个搜索词的项目出现在仅匹配单个搜索词的项目之前。

另一种方法是在使用 PHP 检索记录时将记录分类到存储桶中。假设您在数组中有搜索词$search(按优先级降序排列):

while ($record = mysql_fetch_array($result))
{
  $total = join(' ', $record);
  $found = false;
  foreach ($search as $term)
  {
    if (strpos($total, $term) !== false)
    {
      $buckets[$term][] = $record;
      $found = true;
      break;
    }
  }
  if (!$found)
  {
    $results[] = $record;
  }
}
foreach (array_reverse($search) as $term)
{
  if (isset($buckets[$term]))
  {
    $result = array_merge($buckets[$term], $result);
  }
}

现在您在 array 中获得了结果$results。请注意,这演示了算法,它没有针对性能进行调整。

于 2011-02-10T11:10:27.120 回答
1

我认为解决它的最简单方法是按levenstein distance对结果进行排序。

就像是....

$queryappend="ORDER BY
   length(firstname) - levenshtein(FirstName, '".$searchitems[$i]."') +
   length(lastname)  - levenstein(LastName, '".$searchitems[$i]."')   +
   length(City)      - levenstein(City, '".$searchitems[$i]."')       +
   ...

虽然使用更适合这种搜索的模式可能是个好主意

于 2011-02-10T13:17:10.603 回答