2

我正在开发一个基于 PHP 的系统,用户可以使用 MySQL 数据库创建、发布和查看内容片段,每个内容片段都存储在表格行中。当用户发布内容时,PHP 脚本会提取常用词或标签(删除任何停用词,如“and”和“or”),按出现次数排序,并将它们作为数组存储在数据库中。

除了查看每条内容和生成的标签外,我还想要一个功能,它显示发布的类似内容的列表,这些内容具有所显示的内容具有的一个或多个标签(类似于 YouTube 上的相关视频或相关故事新闻网站)。此外,我希望根据每条内容的标签数量对列表进行排序。

我做了一些研究,并开发了两个不同的脚本,它们可以根据是否存在任何标签从数据库中选择行。但是,这两个脚本都有问题;

我尝试的第一个是 LIKE 查询;

$tags=$row['tags'];
$tags2=explode(",",$tags);
foreach ($tags2 as $key => $keyword) {
    $sql = ("SELECT DISTINCT * FROM table WHERE tags LIKE '%$keyword%' ");
    if ($key != (sizeof($tags2)-1)){ 
        $sql .= " OR "; 
    }
    $sql .= " LIMIT 20";
}

这个查询的问题是它没有对结果进行排序。然后我尝试了 MATCH AGAINST 查询;

$tags=$row['tags'];
$tags2=explode(",",$tags);
$searchstring="";
foreach ($tags2 as $word){
    $searchstring = $searchstring .' +'.$word;
}
$sql = ("SELECT * FROM table WHERE MATCH (tags) AGAINST ('$searchstring' IN BOOLEAN MODE)");

虽然结果按相关性排序,但它只检索存在所有标签的行,如果该行甚至缺少单个标签,则不会被查询检索到。

我想要的是结合这两个功能的优点,选择包含一个或多个标签的行,然后根据存在的标签数量对它们进行排序。例如; 如果 row1 包含 10 个标签,row2 有 20 个标签,其中 9 个在 row1 中,而 row3 有 50 个标签,在 row1 中找到 8 个,则 row2 和 row3 都将被检索,其中 row2 比 row3 更相关。

任何帮助,将不胜感激

4

1 回答 1

2

+角色包含在您$searchstring的内容中是强制所有标签出现的原因。如果您只输入单词并省略+,引擎将对其结果进行排名,而不需要每个单词都存在。

查看MySQL 中全文搜索的文档

每个单词都有很多选项。+将强制在结果中的某处找到该词,-将强制该词在结果中的任何位置都找不到,~将允许找到一个词,但如果找到,则降低结果的排名。阅读文档,它们非常有用。

于 2012-01-09T19:45:30.610 回答